计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2015年
2期
374-377
,共4页
芮志良%朱玉全%耿霞%陈耿
芮誌良%硃玉全%耿霞%陳耿
예지량%주옥전%경하%진경
microRNA 识别%分类能力%特征聚类%随机子空间%相关性
microRNA 識彆%分類能力%特徵聚類%隨機子空間%相關性
microRNA 식별%분류능력%특정취류%수궤자공간%상관성
microRNA identification%classification ability%feature clustering%random subspace%relevance
针对microRNA识别方法中过多注重新特征、忽略弱分类能力特征和冗余特征,导致敏感性和特异性指标不佳或两者不平衡的问题,提出一种基于特征聚类和随机子空间的集成算法CLUSTER-RS.该算法采用信息增益率剔除部分弱分类能力的特征后,利用信息熵度量特征之间相关性,对特征进行聚类,再从每个特征簇中随机选取等量特征组成特征集用于构建基分类器,最后将基分类器集成用于microRNA识别.通过调整参数、选择基分类器实现算法最优化后,在microRNA最新数据集上与经典方法Triplet-SVM、miPred、MiPred、microPred和HuntMi进行对比实验,结果显示CLUSTER-RS在识别中敏感性不及microPred但优于其他模型,特异性为六者最优,而且从整体性能指标准确性和马修兹系数可以看出,CLUSTER-RS比其他算法具有优势.结果表明,CLUSTER-RS取得了较好的识别效果,在敏感性和特异性上实现了很好的平衡,即在性能指标平衡方面优于对比方法.
針對microRNA識彆方法中過多註重新特徵、忽略弱分類能力特徵和冗餘特徵,導緻敏感性和特異性指標不佳或兩者不平衡的問題,提齣一種基于特徵聚類和隨機子空間的集成算法CLUSTER-RS.該算法採用信息增益率剔除部分弱分類能力的特徵後,利用信息熵度量特徵之間相關性,對特徵進行聚類,再從每箇特徵簇中隨機選取等量特徵組成特徵集用于構建基分類器,最後將基分類器集成用于microRNA識彆.通過調整參數、選擇基分類器實現算法最優化後,在microRNA最新數據集上與經典方法Triplet-SVM、miPred、MiPred、microPred和HuntMi進行對比實驗,結果顯示CLUSTER-RS在識彆中敏感性不及microPred但優于其他模型,特異性為六者最優,而且從整體性能指標準確性和馬脩玆繫數可以看齣,CLUSTER-RS比其他算法具有優勢.結果錶明,CLUSTER-RS取得瞭較好的識彆效果,在敏感性和特異性上實現瞭很好的平衡,即在性能指標平衡方麵優于對比方法.
침대microRNA식별방법중과다주중신특정、홀략약분류능력특정화용여특정,도치민감성화특이성지표불가혹량자불평형적문제,제출일충기우특정취류화수궤자공간적집성산법CLUSTER-RS.해산법채용신식증익솔척제부분약분류능력적특정후,이용신식적도량특정지간상관성,대특정진행취류,재종매개특정족중수궤선취등량특정조성특정집용우구건기분류기,최후장기분류기집성용우microRNA식별.통과조정삼수、선택기분류기실현산법최우화후,재microRNA최신수거집상여경전방법Triplet-SVM、miPred、MiPred、microPred화HuntMi진행대비실험,결과현시CLUSTER-RS재식별중민감성불급microPred단우우기타모형,특이성위륙자최우,이차종정체성능지표준학성화마수자계수가이간출,CLUSTER-RS비기타산법구유우세.결과표명,CLUSTER-RS취득료교호적식별효과,재민감성화특이성상실현료흔호적평형,즉재성능지표평형방면우우대비방법.