青岛大学学报(自然科学版)
青島大學學報(自然科學版)
청도대학학보(자연과학판)
JOURNAL OF QINGDAO UNIVERSITY(NATURAL SCIENCE EDITION)
2014年
2期
61-64,89
,共5页
基因名识别%精简特征集%权值向量%学习算法
基因名識彆%精簡特徵集%權值嚮量%學習算法
기인명식별%정간특정집%권치향량%학습산법
gene name recognition%reductive feature%weight vector%learning algorithm
根据生物医学文本中基因名的特点,提出了一组新特征用于基因名的识别.利用精简的特征集,将提出的新特征融合进精简特征集中.应用Global Linear模型和感知机学习算法在BioCreativeⅡ数据集中对提出的方法进行了验证,结果表明,通过使用数量较少的、区分能力强的特征,仍能使系统达到较高的性能.当融合新特征时,系统的精确率和召回率也有一定的提高.
根據生物醫學文本中基因名的特點,提齣瞭一組新特徵用于基因名的識彆.利用精簡的特徵集,將提齣的新特徵融閤進精簡特徵集中.應用Global Linear模型和感知機學習算法在BioCreativeⅡ數據集中對提齣的方法進行瞭驗證,結果錶明,通過使用數量較少的、區分能力彊的特徵,仍能使繫統達到較高的性能.噹融閤新特徵時,繫統的精確率和召迴率也有一定的提高.
근거생물의학문본중기인명적특점,제출료일조신특정용우기인명적식별.이용정간적특정집,장제출적신특정융합진정간특정집중.응용Global Linear모형화감지궤학습산법재BioCreativeⅡ수거집중대제출적방법진행료험증,결과표명,통과사용수량교소적、구분능력강적특정,잉능사계통체도교고적성능.당융합신특정시,계통적정학솔화소회솔야유일정적제고.