西安交通大学学报
西安交通大學學報
서안교통대학학보
JOURNAL OF XI'AN JIAOTONG UNIVERSITY
2008年
2期
171-174
,共4页
崔舒宁%朱丹军%冯博琴%昂正全
崔舒寧%硃丹軍%馮博琴%昂正全
최서저%주단군%풍박금%앙정전
基因本体%分类标注%最邻近算法
基因本體%分類標註%最鄰近算法
기인본체%분류표주%최린근산법
通过研究有关基因的生物学文献特征,提出了一种能对生物基因文献进行自动标注与分类的方法.在 K 最邻近算法的基础上,采用了 Chi-Square 特征选择方案,并且在加权算法中突出了Chi-Square 的选择特点.另外,采用文档逻辑分块法,将额外的生物受控词汇表中的信息所形成的向量直接引入到了分类算法中,以提高分类和标注的效果.实验表明,所提算法优于常用的单词频率/逆文档频率加权方法,其在文本检索大会(TREC)数据集上的分类、标注效果分别比 TREC 公布的最好结果提高了3.14%和4.12%.
通過研究有關基因的生物學文獻特徵,提齣瞭一種能對生物基因文獻進行自動標註與分類的方法.在 K 最鄰近算法的基礎上,採用瞭 Chi-Square 特徵選擇方案,併且在加權算法中突齣瞭Chi-Square 的選擇特點.另外,採用文檔邏輯分塊法,將額外的生物受控詞彙錶中的信息所形成的嚮量直接引入到瞭分類算法中,以提高分類和標註的效果.實驗錶明,所提算法優于常用的單詞頻率/逆文檔頻率加權方法,其在文本檢索大會(TREC)數據集上的分類、標註效果分彆比 TREC 公佈的最好結果提高瞭3.14%和4.12%.
통과연구유관기인적생물학문헌특정,제출료일충능대생물기인문헌진행자동표주여분류적방법.재 K 최린근산법적기출상,채용료 Chi-Square 특정선택방안,병차재가권산법중돌출료Chi-Square 적선택특점.령외,채용문당라집분괴법,장액외적생물수공사회표중적신식소형성적향량직접인입도료분류산법중,이제고분류화표주적효과.실험표명,소제산법우우상용적단사빈솔/역문당빈솔가권방법,기재문본검색대회(TREC)수거집상적분류、표주효과분별비 TREC 공포적최호결과제고료3.14%화4.12%.