计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2012年
1期
134-145
,共12页
信息流%蜂群算法%聚类%蛋白质相互作用网络
信息流%蜂群算法%聚類%蛋白質相互作用網絡
신식류%봉군산법%취류%단백질상호작용망락
蛋白质相互作用网络的聚类算法研究是充分理解分子的结构、功能及识别蛋白质的功能模块的重要方法.很多传统聚类算法对于蛋白质相互作用网络聚类效果不佳.功能流模拟算法是一种新型聚类算法,但该算法没有考虑到距离的作用效果并且需要人为地设置合并阈值,带有主观性.文中提出了一种新颖的基于蜂群优化机理的信息流聚类模型与算法.该方法中,数据预处理采用结点网络综合特征值的排序来初始化聚类中心,将蜂群算法的蜜源位置对应于其聚类中心,蜜源的收益度大小对应于模块间的相似度,采蜜蜂结点的所有邻接点按照结点网络综合特征值的降序排列,作为侦察蜂的搜索邻域.采用正确率、查全率等指标对聚类效果做出客观评价,并对算法的一些关键参数进行仿真、对比与分析.结果表明新算法不仅克服了原功能流模拟算法的缺点,且其正确率和查全率的几何平均值最高,能够有效地识别蛋白质功能模块.
蛋白質相互作用網絡的聚類算法研究是充分理解分子的結構、功能及識彆蛋白質的功能模塊的重要方法.很多傳統聚類算法對于蛋白質相互作用網絡聚類效果不佳.功能流模擬算法是一種新型聚類算法,但該算法沒有攷慮到距離的作用效果併且需要人為地設置閤併閾值,帶有主觀性.文中提齣瞭一種新穎的基于蜂群優化機理的信息流聚類模型與算法.該方法中,數據預處理採用結點網絡綜閤特徵值的排序來初始化聚類中心,將蜂群算法的蜜源位置對應于其聚類中心,蜜源的收益度大小對應于模塊間的相似度,採蜜蜂結點的所有鄰接點按照結點網絡綜閤特徵值的降序排列,作為偵察蜂的搜索鄰域.採用正確率、查全率等指標對聚類效果做齣客觀評價,併對算法的一些關鍵參數進行倣真、對比與分析.結果錶明新算法不僅剋服瞭原功能流模擬算法的缺點,且其正確率和查全率的幾何平均值最高,能夠有效地識彆蛋白質功能模塊.
단백질상호작용망락적취류산법연구시충분리해분자적결구、공능급식별단백질적공능모괴적중요방법.흔다전통취류산법대우단백질상호작용망락취류효과불가.공능류모의산법시일충신형취류산법,단해산법몰유고필도거리적작용효과병차수요인위지설치합병역치,대유주관성.문중제출료일충신영적기우봉군우화궤리적신식류취류모형여산법.해방법중,수거예처리채용결점망락종합특정치적배서래초시화취류중심,장봉군산법적밀원위치대응우기취류중심,밀원적수익도대소대응우모괴간적상사도,채밀봉결점적소유린접점안조결점망락종합특정치적강서배렬,작위정찰봉적수색린역.채용정학솔、사전솔등지표대취류효과주출객관평개,병대산법적일사관건삼수진행방진、대비여분석.결과표명신산법불부극복료원공능류모의산법적결점,차기정학솔화사전솔적궤하평균치최고,능구유효지식별단백질공능모괴.