生物信息学
生物信息學
생물신식학
BIOINFORMATICS
2009年
2期
95-98
,共4页
刘文远%李建飞%王宝文%于家新
劉文遠%李建飛%王寶文%于傢新
류문원%리건비%왕보문%우가신
基因表达数据%聚类分析%熵%互信息%伪F统计量
基因錶達數據%聚類分析%熵%互信息%偽F統計量
기인표체수거%취류분석%적%호신식%위F통계량
k-均值聚类算法是一种广泛应用于基因表达数据聚类分析中的迭代变换算法,它通常用距离法来表示基因间的关系,但不能有效的反应基因间的相互依赖的关系.为此,提出基于信息论的k-modes聚类算法,克服了以上缺点.另外,还引入了伪F 统计量,一方面,可以对空间中有部分重叠的点进行有效的分类;另一方面,可以给出最佳聚类数目,从而弥补了k-modes聚类法的不足.使其成为一种非常有效的算法,从而达到较优的聚类效果.
k-均值聚類算法是一種廣汎應用于基因錶達數據聚類分析中的迭代變換算法,它通常用距離法來錶示基因間的關繫,但不能有效的反應基因間的相互依賴的關繫.為此,提齣基于信息論的k-modes聚類算法,剋服瞭以上缺點.另外,還引入瞭偽F 統計量,一方麵,可以對空間中有部分重疊的點進行有效的分類;另一方麵,可以給齣最佳聚類數目,從而瀰補瞭k-modes聚類法的不足.使其成為一種非常有效的算法,從而達到較優的聚類效果.
k-균치취류산법시일충엄범응용우기인표체수거취류분석중적질대변환산법,타통상용거리법래표시기인간적관계,단불능유효적반응기인간적상호의뢰적관계.위차,제출기우신식론적k-modes취류산법,극복료이상결점.령외,환인입료위F 통계량,일방면,가이대공간중유부분중첩적점진행유효적분류;령일방면,가이급출최가취류수목,종이미보료k-modes취류법적불족.사기성위일충비상유효적산법,종이체도교우적취류효과.