计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2007年
2期
311-316
,共6页
聚类分析%基因表达谱%分层聚类%负载平衡
聚類分析%基因錶達譜%分層聚類%負載平衡
취류분석%기인표체보%분층취류%부재평형
跨物种的生物序列比较已经被广泛应用于基因功能预测,而越来越多的实验表明序列相似性并不足以保证基因功能相似.为了精确确定基因功能,不仅需要考虑序列性质,还需探索基因表达信息的特性,因为基因表达的改变往往伴随着基因功能的改变.通过聚类分析基因表达谱,可以直观判断协同表达基因及其规律,这是考察基因功能的重要一步.由于生物组织基因表达的复杂性,以及识别表达的microarray技术和理念的不断更新,表达数据的规模也呈指数规律递增,聚类分析遭遇了巨大瓶颈--过高的时空复杂度.根据"基因表达谱"的数据特征,对处理表达谱数据的分层聚类提出了一种并行分层聚类算法--PHCA,主要解决了并行设计的负载平衡问题,并实现了MPI平台的并行程序设计.并行程序性能分析表明,PHCA算法较大幅度降低了分层聚类算法的时空复杂度.
跨物種的生物序列比較已經被廣汎應用于基因功能預測,而越來越多的實驗錶明序列相似性併不足以保證基因功能相似.為瞭精確確定基因功能,不僅需要攷慮序列性質,還需探索基因錶達信息的特性,因為基因錶達的改變往往伴隨著基因功能的改變.通過聚類分析基因錶達譜,可以直觀判斷協同錶達基因及其規律,這是攷察基因功能的重要一步.由于生物組織基因錶達的複雜性,以及識彆錶達的microarray技術和理唸的不斷更新,錶達數據的規模也呈指數規律遞增,聚類分析遭遇瞭巨大瓶頸--過高的時空複雜度.根據"基因錶達譜"的數據特徵,對處理錶達譜數據的分層聚類提齣瞭一種併行分層聚類算法--PHCA,主要解決瞭併行設計的負載平衡問題,併實現瞭MPI平檯的併行程序設計.併行程序性能分析錶明,PHCA算法較大幅度降低瞭分層聚類算法的時空複雜度.
과물충적생물서렬비교이경피엄범응용우기인공능예측,이월래월다적실험표명서렬상사성병불족이보증기인공능상사.위료정학학정기인공능,불부수요고필서렬성질,환수탐색기인표체신식적특성,인위기인표체적개변왕왕반수착기인공능적개변.통과취류분석기인표체보,가이직관판단협동표체기인급기규률,저시고찰기인공능적중요일보.유우생물조직기인표체적복잡성,이급식별표체적microarray기술화이념적불단경신,표체수거적규모야정지수규률체증,취류분석조우료거대병경--과고적시공복잡도.근거"기인표체보"적수거특정,대처리표체보수거적분층취류제출료일충병행분층취류산법--PHCA,주요해결료병행설계적부재평형문제,병실현료MPI평태적병행정서설계.병행정서성능분석표명,PHCA산법교대폭도강저료분층취류산법적시공복잡도.