中国生物医学工程学报
中國生物醫學工程學報
중국생물의학공정학보
CHINESE JOURNAL OF BIOMEDICAL ENGINEERING
2009年
5期
701-706
,共6页
李哲谦%刘书朋%严壮志%辛艳飞
李哲謙%劉書朋%嚴壯誌%辛豔飛
리철겸%류서붕%엄장지%신염비
蛋白质-蛋白质相互作用%支持向量机%离散信息度量函数
蛋白質-蛋白質相互作用%支持嚮量機%離散信息度量函數
단백질-단백질상호작용%지지향량궤%리산신식도량함수
protein-protein interactions%support vector machine%function of degree of disagreement
蛋白质与蛋白质相互作用研究是蛋白质组学的重要研究内容之一.本研究采用支持向量机学习方法,将氨基酸物理化学特性和序列信息方法相结合构建支持向量,选取DIP数据库中的酵母表达蛋白序列进行蛋白质相互作用预测.在34 000对酵母表达蛋白实验数据中,预测准确率达到83.72%,而单独运用基于氨基酸物理化学特性的方法和基于序列信息的方法预测准确率分别为75.86%和79.63%.在提高预测准确率的同时通过引入离散信息度量函数(FDOD)减少支持向量的维数,使支持向量学习时间缩短,提高相互作用预测的速度.
蛋白質與蛋白質相互作用研究是蛋白質組學的重要研究內容之一.本研究採用支持嚮量機學習方法,將氨基痠物理化學特性和序列信息方法相結閤構建支持嚮量,選取DIP數據庫中的酵母錶達蛋白序列進行蛋白質相互作用預測.在34 000對酵母錶達蛋白實驗數據中,預測準確率達到83.72%,而單獨運用基于氨基痠物理化學特性的方法和基于序列信息的方法預測準確率分彆為75.86%和79.63%.在提高預測準確率的同時通過引入離散信息度量函數(FDOD)減少支持嚮量的維數,使支持嚮量學習時間縮短,提高相互作用預測的速度.
단백질여단백질상호작용연구시단백질조학적중요연구내용지일.본연구채용지지향량궤학습방법,장안기산물이화학특성화서렬신식방법상결합구건지지향량,선취DIP수거고중적효모표체단백서렬진행단백질상호작용예측.재34 000대효모표체단백실험수거중,예측준학솔체도83.72%,이단독운용기우안기산물이화학특성적방법화기우서렬신식적방법예측준학솔분별위75.86%화79.63%.재제고예측준학솔적동시통과인입리산신식도량함수(FDOD)감소지지향량적유수,사지지향량학습시간축단,제고상호작용예측적속도.
Protein-protein interaction is an important issue in proteomics research. In this study, two predition methods, including support vector machine (SVM) and information analysis of physical and chemical properties and sequence information of amino acid, were used to construct the feature vectors for predicting protein-protein interaction. Data of protein expression by 34000 pairs of yeast were taken from DIP database. The prediction accuracy by the method of sequence information of amino acid was 79.63%, and the prediction accuracy by the method of information analysis of physical and chemical properties 75.86%. An improved method was proposed by combing the above two to make the prediction accuracy up to 83.72%. Furthermore, the function of degree of disagreement (FDOD) was used to reduce the dimension of support vector.