内蒙古工业大学学报(自然科学版)
內矇古工業大學學報(自然科學版)
내몽고공업대학학보(자연과학판)
JOURNAL OF INNER MONGOLIA UNIVERSITY OF TECHNOLOGY(NATURAL SCIENCE EDITION)
2014年
1期
14-20
,共7页
钙结合蛋白%离散增量算法%矩阵打分算法%支持向量机算法
鈣結閤蛋白%離散增量算法%矩陣打分算法%支持嚮量機算法
개결합단백%리산증량산법%구진타분산법%지지향량궤산법
Calbindin%Increment of diversity algorithm%Matrix scoring value algorithm%Support Vector Machine algorithm
钙结合蛋白在诸多重要的生命进程中实现着不可替代的生物学功能。而这些功能的实现,均取决于蛋白质中配体结合残基与钙离子的相互作用。因此,对蛋白质中钙离子结合残基的识别是理解这种重要分子机制的有效手段。建立了396条非冗余蛋白质链共包含1952个钙离子结合残基的钙离子结合蛋白数据集,通过统计分析确定以17个氨基酸残基作为最佳片段长度。使用10交叉检验,以氨基酸组分为特征参数的离散增量算法的预测精度为62.4%,相关系数为0.25;以位点氨基酸保守性信息为特征参数的矩阵打分算法的预测精度为69.9%,相关系数为0.40;以离散增量值、矩阵打分值和自协方差值为特征参数的支持向量机算法的预测精度为75.0%,相关系数为0.50。
鈣結閤蛋白在諸多重要的生命進程中實現著不可替代的生物學功能。而這些功能的實現,均取決于蛋白質中配體結閤殘基與鈣離子的相互作用。因此,對蛋白質中鈣離子結閤殘基的識彆是理解這種重要分子機製的有效手段。建立瞭396條非冗餘蛋白質鏈共包含1952箇鈣離子結閤殘基的鈣離子結閤蛋白數據集,通過統計分析確定以17箇氨基痠殘基作為最佳片段長度。使用10交扠檢驗,以氨基痠組分為特徵參數的離散增量算法的預測精度為62.4%,相關繫數為0.25;以位點氨基痠保守性信息為特徵參數的矩陣打分算法的預測精度為69.9%,相關繫數為0.40;以離散增量值、矩陣打分值和自協方差值為特徵參數的支持嚮量機算法的預測精度為75.0%,相關繫數為0.50。
개결합단백재제다중요적생명진정중실현착불가체대적생물학공능。이저사공능적실현,균취결우단백질중배체결합잔기여개리자적상호작용。인차,대단백질중개리자결합잔기적식별시리해저충중요분자궤제적유효수단。건립료396조비용여단백질련공포함1952개개리자결합잔기적개리자결합단백수거집,통과통계분석학정이17개안기산잔기작위최가편단장도。사용10교차검험,이안기산조분위특정삼수적리산증량산법적예측정도위62.4%,상관계수위0.25;이위점안기산보수성신식위특정삼수적구진타분산법적예측정도위69.9%,상관계수위0.40;이리산증량치、구진타분치화자협방차치위특정삼수적지지향량궤산법적예측정도위75.0%,상관계수위0.50。
Calbindin plays a critical role in many important life processes .The realization of this bi-ology function depends on interaction between the ligand binding residues and calcium ions .Thus ,the recognition of calcium binding residues is an effective method to understand this molecular mechanism . Based on 396 calcium binding proteins containing 1952 calcium binding residues ,we built a non -re-dundant calbindin database .Through statistical analysis ,optimum length of sequences segments was selected as 17 amino acid residues .With amino acid composition as the inputted parameter for incre-ment of diversity algorithm ,the overall prediction accuracy and MCC was 62 .4% and 0 .25 by 10-fold cross-validation ,respectively .When with conservation of position as the parameter for the matrix scoring value algorithm ,the overall prediction accuracy and MCC achieved 69 .9% and 0 .40 by 10 -fold cross -validation ,respectively .While with increment of diversity values ,matrix scoring values and auto covariance of physicochemical property index as the parameters for support vector machine , the overall prediction accuracy and MCC achieved 75% and 0 .5 by 10-fold cross -validation ,respec-tively .