食品与生物技术学报
食品與生物技術學報
식품여생물기술학보
JOURNAL OF FOOD SCIENCE AND BIOTECHNOLOGY
2010年
1期
123-127
,共5页
梅娟%何胜%王正祥%石贵阳%李炜疆
梅娟%何勝%王正祥%石貴暘%李煒疆
매연%하성%왕정상%석귀양%리위강
蛋白质网络%序列相似性%远同源性%模块性%聚类%蛋白质结构分类数据库
蛋白質網絡%序列相似性%遠同源性%模塊性%聚類%蛋白質結構分類數據庫
단백질망락%서렬상사성%원동원성%모괴성%취류%단백질결구분류수거고
protein network%sequence similarity%remote homology%modularity%clustering%SCOP
蛋白质的远同源性探测是结构基因组学和功能基因组学的主要研究任务之一.一些具有一定相似结构和功能、但序列相似性却较低的蛋白质组成蛋白质超家族,则远同源性探测问题等价于对蛋白质超家族的识别问题.作者提出了一种基于模块性的聚类算法ModuleFind,该方法通过最大化蛋白质网络的模块性来寻找具有较强集团结构的划分.在蛋白质结构分类数据库(SCOP)超家族层次上进行的实验表明,该方法得到的聚类结果更接近分类基准,且具有较高的F-测度值.
蛋白質的遠同源性探測是結構基因組學和功能基因組學的主要研究任務之一.一些具有一定相似結構和功能、但序列相似性卻較低的蛋白質組成蛋白質超傢族,則遠同源性探測問題等價于對蛋白質超傢族的識彆問題.作者提齣瞭一種基于模塊性的聚類算法ModuleFind,該方法通過最大化蛋白質網絡的模塊性來尋找具有較彊集糰結構的劃分.在蛋白質結構分類數據庫(SCOP)超傢族層次上進行的實驗錶明,該方法得到的聚類結果更接近分類基準,且具有較高的F-測度值.
단백질적원동원성탐측시결구기인조학화공능기인조학적주요연구임무지일.일사구유일정상사결구화공능、단서렬상사성각교저적단백질조성단백질초가족,칙원동원성탐측문제등개우대단백질초가족적식별문제.작자제출료일충기우모괴성적취류산법ModuleFind,해방법통과최대화단백질망락적모괴성래심조구유교강집단결구적화분.재단백질결구분류수거고(SCOP)초가족층차상진행적실험표명,해방법득도적취류결과경접근분류기준,차구유교고적F-측도치.
Remote homology detection between protein sequences is one of the principal research objectives in structural and functional genomics. Proteins with similar structure and function but low sequence similarity consist of protein superfamily. Therefore, the detection of remote homologues is the task of identifying protein superfamily. In this manuscript, a clustering algorithm, called ModuleFind, based on network modularity was presented. The method maximizes the modularity of protein network to find the partitioning with strong community structure. The resulting algorithm gives high quality of clusters quantified by F-measure that combines precise and recall, in the experiments of the detection of the remote homologues based on the superfamily level of SCOP database.