计算机与应用化学
計算機與應用化學
계산궤여응용화학
COMPUTERS AND APPLIED CHEMISTRY
2007年
10期
1341-1344
,共4页
药物专利%文本分类%支持向量机%信息检索
藥物專利%文本分類%支持嚮量機%信息檢索
약물전리%문본분류%지지향량궤%신식검색
为实现药物专利的自动分类,本文结合药物专利的特点,研究了机器学习算法如何应用于药物专利分类.将2000余份药物专利按疗效分类,选取其中五类作为训练样本,对每一类提取特征文本,利用向量空间模型将非结构化的文本数字化,用支持向量机、Naive Bayes、RBFNetwork三种机器学习算法,分别测试专利样本的分类,使用5重交叉验证比较了三种算法的查准率(precision)和召回率(recall),结果表明支持向量机的分类效果最好.将机器学习算法应用于药物化学专利分类,有助于提高药物化学专利信息检索的效率.
為實現藥物專利的自動分類,本文結閤藥物專利的特點,研究瞭機器學習算法如何應用于藥物專利分類.將2000餘份藥物專利按療效分類,選取其中五類作為訓練樣本,對每一類提取特徵文本,利用嚮量空間模型將非結構化的文本數字化,用支持嚮量機、Naive Bayes、RBFNetwork三種機器學習算法,分彆測試專利樣本的分類,使用5重交扠驗證比較瞭三種算法的查準率(precision)和召迴率(recall),結果錶明支持嚮量機的分類效果最好.將機器學習算法應用于藥物化學專利分類,有助于提高藥物化學專利信息檢索的效率.
위실현약물전리적자동분류,본문결합약물전리적특점,연구료궤기학습산법여하응용우약물전리분류.장2000여빈약물전리안료효분류,선취기중오류작위훈련양본,대매일류제취특정문본,이용향량공간모형장비결구화적문본수자화,용지지향량궤、Naive Bayes、RBFNetwork삼충궤기학습산법,분별측시전리양본적분류,사용5중교차험증비교료삼충산법적사준솔(precision)화소회솔(recall),결과표명지지향량궤적분류효과최호.장궤기학습산법응용우약물화학전리분류,유조우제고약물화학전리신식검색적효솔.