微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2010年
10期
20-21,43
,共3页
王立鹏%袁占亭%陈旭辉%周智芳
王立鵬%袁佔亭%陳旭輝%週智芳
왕립붕%원점정%진욱휘%주지방
KPCA%膜蛋白%二肽组成%降维算法%生物信息学
KPCA%膜蛋白%二肽組成%降維算法%生物信息學
KPCA%막단백%이태조성%강유산법%생물신식학
众所周知,研究未知膜蛋白的类型可对基础研究和药物发现提供有用的线索.在后基因组时代,伴随着蛋白质序列数量的剧增,用实验方法确定膜蛋白类型太过昂贵和费时.因此,研究出一种能够自动发现可能的膜蛋白的计算方法变得很重要.鉴于这种情况,曾有人采用DC(Dipeptide Composition)方法表示蛋白质序列并取得了很好的预测结果.然而,采用这种表示方法得到的特征维数很高,冗余很大,使得预测系统十分复杂.为了解决这个问题,本文采用非线性降维算法KPCA (Ker-nel Principle component analysis),通过从高维的DC (Dipeptide Composition)特征空间中提取出低维的重要特征来简化该系统,采用K-NN(K-nearest neighbor)分类器从约简后的低维特征中预测膜蛋白类型.实验结果表明,使用KPCA方法预测膜蛋白类型非常有效.
衆所週知,研究未知膜蛋白的類型可對基礎研究和藥物髮現提供有用的線索.在後基因組時代,伴隨著蛋白質序列數量的劇增,用實驗方法確定膜蛋白類型太過昂貴和費時.因此,研究齣一種能夠自動髮現可能的膜蛋白的計算方法變得很重要.鑒于這種情況,曾有人採用DC(Dipeptide Composition)方法錶示蛋白質序列併取得瞭很好的預測結果.然而,採用這種錶示方法得到的特徵維數很高,冗餘很大,使得預測繫統十分複雜.為瞭解決這箇問題,本文採用非線性降維算法KPCA (Ker-nel Principle component analysis),通過從高維的DC (Dipeptide Composition)特徵空間中提取齣低維的重要特徵來簡化該繫統,採用K-NN(K-nearest neighbor)分類器從約簡後的低維特徵中預測膜蛋白類型.實驗結果錶明,使用KPCA方法預測膜蛋白類型非常有效.
음소주지,연구미지막단백적류형가대기출연구화약물발현제공유용적선색.재후기인조시대,반수착단백질서렬수량적극증,용실험방법학정막단백류형태과앙귀화비시.인차,연구출일충능구자동발현가능적막단백적계산방법변득흔중요.감우저충정황,증유인채용DC(Dipeptide Composition)방법표시단백질서렬병취득료흔호적예측결과.연이,채용저충표시방법득도적특정유수흔고,용여흔대,사득예측계통십분복잡.위료해결저개문제,본문채용비선성강유산법KPCA (Ker-nel Principle component analysis),통과종고유적DC (Dipeptide Composition)특정공간중제취출저유적중요특정래간화해계통,채용K-NN(K-nearest neighbor)분류기종약간후적저유특정중예측막단백류형.실험결과표명,사용KPCA방법예측막단백류형비상유효.