清华大学学报(自然科学版)
清華大學學報(自然科學版)
청화대학학보(자연과학판)
Journal of Tsinghua University
2004年
9期
1286-1289
,共4页
袁远%季星来%孙之荣%李衍达
袁遠%季星來%孫之榮%李衍達
원원%계성래%손지영%리연체
基因表达谱%等容特征映射%k均值算法%聚类算法
基因錶達譜%等容特徵映射%k均值算法%聚類算法
기인표체보%등용특정영사%k균치산법%취류산법
基因表达谱数据的聚类分析对于研究基因功能和基因调控机制有重要意义.基于非线性降维算法等容特征映射,提出了一种新的大规模基因表达谱数据聚类算法,该方法改进了样本向量之间的距离度量,用测地距离代替传统的欧式距离,有助于挖掘高维数据内在的几何结构.将该算法应用于两个公开的基因表达数据集,并用一种新的评价方法Normalized Cut将聚类结果与其他聚类方法的结果进行了比较.结果表明,该文的聚类算法优于其他聚类算法,聚类结果具有明显的生物学意义,并能对数据的类别数作出较好的预测和评估.
基因錶達譜數據的聚類分析對于研究基因功能和基因調控機製有重要意義.基于非線性降維算法等容特徵映射,提齣瞭一種新的大規模基因錶達譜數據聚類算法,該方法改進瞭樣本嚮量之間的距離度量,用測地距離代替傳統的歐式距離,有助于挖掘高維數據內在的幾何結構.將該算法應用于兩箇公開的基因錶達數據集,併用一種新的評價方法Normalized Cut將聚類結果與其他聚類方法的結果進行瞭比較.結果錶明,該文的聚類算法優于其他聚類算法,聚類結果具有明顯的生物學意義,併能對數據的類彆數作齣較好的預測和評估.
기인표체보수거적취류분석대우연구기인공능화기인조공궤제유중요의의.기우비선성강유산법등용특정영사,제출료일충신적대규모기인표체보수거취류산법,해방법개진료양본향량지간적거리도량,용측지거리대체전통적구식거리,유조우알굴고유수거내재적궤하결구.장해산법응용우량개공개적기인표체수거집,병용일충신적평개방법Normalized Cut장취류결과여기타취류방법적결과진행료비교.결과표명,해문적취류산법우우기타취류산법,취류결과구유명현적생물학의의,병능대수거적유별수작출교호적예측화평고.