计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2008年
11期
1865-1873
,共9页
闫雷鸣%孙志挥%吴英杰%张柏礼
閆雷鳴%孫誌揮%吳英傑%張柏禮
염뢰명%손지휘%오영걸%장백례
二次互信息%非线性相关%联合聚类%生物信息学%基因表达数据
二次互信息%非線性相關%聯閤聚類%生物信息學%基因錶達數據
이차호신식%비선성상관%연합취류%생물신식학%기인표체수거
为聚类非线性相关的数据对象,引入广义信息论中二次互信息作为相似性度量,利用矩阵理论降低了二次互信息的计算量,并结合滑动窗口技术,建立了一种时序数据非线性相关模型.在此基础上提出了适用于时序基因表达数据的确定性联合聚类算法MI-TSB.该算法将时序数据转化为抽象字符序列,然后插入到MI-泛化后缀树中,避免了穷举各种组合,从而快速索引全部聚类结果.实验结果显示MI-TSB算法具有良好的运行性能,成功聚类出非线性相关的对象;利用Gene Ontology对聚类结果进行基因注释,也验证了聚类结果的生物学意义.
為聚類非線性相關的數據對象,引入廣義信息論中二次互信息作為相似性度量,利用矩陣理論降低瞭二次互信息的計算量,併結閤滑動窗口技術,建立瞭一種時序數據非線性相關模型.在此基礎上提齣瞭適用于時序基因錶達數據的確定性聯閤聚類算法MI-TSB.該算法將時序數據轉化為抽象字符序列,然後插入到MI-汎化後綴樹中,避免瞭窮舉各種組閤,從而快速索引全部聚類結果.實驗結果顯示MI-TSB算法具有良好的運行性能,成功聚類齣非線性相關的對象;利用Gene Ontology對聚類結果進行基因註釋,也驗證瞭聚類結果的生物學意義.
위취류비선성상관적수거대상,인입엄의신식론중이차호신식작위상사성도량,이용구진이론강저료이차호신식적계산량,병결합활동창구기술,건립료일충시서수거비선성상관모형.재차기출상제출료괄용우시서기인표체수거적학정성연합취류산법MI-TSB.해산법장시서수거전화위추상자부서렬,연후삽입도MI-범화후철수중,피면료궁거각충조합,종이쾌속색인전부취류결과.실험결과현시MI-TSB산법구유량호적운행성능,성공취류출비선성상관적대상;이용Gene Ontology대취류결과진행기인주석,야험증료취류결과적생물학의의.