生物学杂志
生物學雜誌
생물학잡지
JOURNAL OF BIOLOGY
2011年
6期
58-61
,共4页
基因表达谱%样条变换%偏最小二乘%筛选法%过拟合
基因錶達譜%樣條變換%偏最小二乘%篩選法%過擬閤
기인표체보%양조변환%편최소이승%사선법%과의합
肝癌是中国最常见的恶性肿瘤之一.基于肿瘤基因表达谱数据的分析与研究是当今研究的热点,对于癌症的早期诊断、治疗具有十分重要的意义.针对高维小样本基因表达谱数据所显现的变量间严重共线性、类别变量与预测变量的非线性关系,采用了基于样条变换的偏最小二乘回归新技术.首先通过筛选法去除基因表达谱数据中的冗余信息,然后以3次B基样条变换实现非线性基因表达谱数据的线性化重构,随后将重构的矩阵交由偏最小二乘法构建类别变量与预测变量间的关系模型.最后,通过对肝癌肿瘤基因表达谱数据的分析,结果显示此分类模型时数据重构稳健,有效的解决了高维小样本基因表达谱数据间的过拟合和变量间的共线性,具有较高的拟合和分类正确率.
肝癌是中國最常見的噁性腫瘤之一.基于腫瘤基因錶達譜數據的分析與研究是噹今研究的熱點,對于癌癥的早期診斷、治療具有十分重要的意義.針對高維小樣本基因錶達譜數據所顯現的變量間嚴重共線性、類彆變量與預測變量的非線性關繫,採用瞭基于樣條變換的偏最小二乘迴歸新技術.首先通過篩選法去除基因錶達譜數據中的冗餘信息,然後以3次B基樣條變換實現非線性基因錶達譜數據的線性化重構,隨後將重構的矩陣交由偏最小二乘法構建類彆變量與預測變量間的關繫模型.最後,通過對肝癌腫瘤基因錶達譜數據的分析,結果顯示此分類模型時數據重構穩健,有效的解決瞭高維小樣本基因錶達譜數據間的過擬閤和變量間的共線性,具有較高的擬閤和分類正確率.
간암시중국최상견적악성종류지일.기우종류기인표체보수거적분석여연구시당금연구적열점,대우암증적조기진단、치료구유십분중요적의의.침대고유소양본기인표체보수거소현현적변량간엄중공선성、유별변량여예측변량적비선성관계,채용료기우양조변환적편최소이승회귀신기술.수선통과사선법거제기인표체보수거중적용여신식,연후이3차B기양조변환실현비선성기인표체보수거적선성화중구,수후장중구적구진교유편최소이승법구건유별변량여예측변량간적관계모형.최후,통과대간암종류기인표체보수거적분석,결과현시차분류모형시수거중구은건,유효적해결료고유소양본기인표체보수거간적과의합화변량간적공선성,구유교고적의합화분류정학솔.