电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2008年
30期
531-533
,共3页
文本分类%特征选择%医药信息
文本分類%特徵選擇%醫藥信息
문본분류%특정선택%의약신식
自动文本分类技术是组织和管理医药信息的一个有效的办法.本文主要针对医药信息的自动文本分类系统展开研究,重点研究如何根据医药领域的特点进行有效的特征选择,提出了使用文档频率DF和互信息MI相结合进行医药特征选择的方法.另外,本文还构建了一个医药信息语料库作为医药信息自动文本分类系统的训练集和测试集,该语料库包含五个类别,600篇文本.实验证明,该方法能够有效提高医药文本分类系统的分类速度和精度.
自動文本分類技術是組織和管理醫藥信息的一箇有效的辦法.本文主要針對醫藥信息的自動文本分類繫統展開研究,重點研究如何根據醫藥領域的特點進行有效的特徵選擇,提齣瞭使用文檔頻率DF和互信息MI相結閤進行醫藥特徵選擇的方法.另外,本文還構建瞭一箇醫藥信息語料庫作為醫藥信息自動文本分類繫統的訓練集和測試集,該語料庫包含五箇類彆,600篇文本.實驗證明,該方法能夠有效提高醫藥文本分類繫統的分類速度和精度.
자동문본분류기술시조직화관리의약신식적일개유효적판법.본문주요침대의약신식적자동문본분류계통전개연구,중점연구여하근거의약영역적특점진행유효적특정선택,제출료사용문당빈솔DF화호신식MI상결합진행의약특정선택적방법.령외,본문환구건료일개의약신식어료고작위의약신식자동문본분류계통적훈련집화측시집,해어료고포함오개유별,600편문본.실험증명,해방법능구유효제고의약문본분류계통적분류속도화정도.