生物信息学
生物信息學
생물신식학
BIOINFORMATICS
2009年
1期
47-51
,共5页
基因芯片%流形学习%数据降维可视化
基因芯片%流形學習%數據降維可視化
기인심편%류형학습%수거강유가시화
基因表达谱的可视化本质上是高维数据的降维问题.采用流形学习算法来解决基因表达谱的降维数据可视化,讨论了典型的流形学习算法(Isomap和LLE)在表达谱降维中的适用性.通过类内/类间距离定量评价数据降维的效果,对两个典型基因芯片数据集(结肠癌基因表达谱数据集和急性白血病基因表达谱数据集)进行降维分析,发现两个数据集的本征维数都低于3, 因而可以用流形学习方法在低维投影空间中进行可视化.与传统的降维方法(如PCA和MDS)的投影结果作比较, 显示Isomap流形学习方法有更好的可视化效果.
基因錶達譜的可視化本質上是高維數據的降維問題.採用流形學習算法來解決基因錶達譜的降維數據可視化,討論瞭典型的流形學習算法(Isomap和LLE)在錶達譜降維中的適用性.通過類內/類間距離定量評價數據降維的效果,對兩箇典型基因芯片數據集(結腸癌基因錶達譜數據集和急性白血病基因錶達譜數據集)進行降維分析,髮現兩箇數據集的本徵維數都低于3, 因而可以用流形學習方法在低維投影空間中進行可視化.與傳統的降維方法(如PCA和MDS)的投影結果作比較, 顯示Isomap流形學習方法有更好的可視化效果.
기인표체보적가시화본질상시고유수거적강유문제.채용류형학습산법래해결기인표체보적강유수거가시화,토론료전형적류형학습산법(Isomap화LLE)재표체보강유중적괄용성.통과류내/류간거리정량평개수거강유적효과,대량개전형기인심편수거집(결장암기인표체보수거집화급성백혈병기인표체보수거집)진행강유분석,발현량개수거집적본정유수도저우3, 인이가이용류형학습방법재저유투영공간중진행가시화.여전통적강유방법(여PCA화MDS)적투영결과작비교, 현시Isomap류형학습방법유경호적가시화효과.