计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2010年
z1期
302-308
,共7页
王章辉%赵宇海%王国仁%李源
王章輝%趙宇海%王國仁%李源
왕장휘%조우해%왕국인%리원
投影聚类%基因表达数据%序列数据%样本穷举树%表型划分
投影聚類%基因錶達數據%序列數據%樣本窮舉樹%錶型劃分
투영취류%기인표체수거%서렬수거%양본궁거수%표형화분
高通量微阵列技术与手工表型标定方式间的矛盾导致了基因表达数据的获取与表型确定间的不平衡.然而,已有的表型区分方法大多是有监督的,并且通常忽略了基因间广泛存在的相互作用,根据单个基因的独立区分能力划分样本表型,选择相关基因.从新的视角,基于投影聚类的思想,提出一种考虑基因间相互关系的无监督表型区分算法USPD.通过将基因表达数据转化为具有负间隔约束的序列数据,强化了基因间的相互关系.利用设计的质量函数,采用深度优先方式遍历样本穷举树,无监督地生成样本表型划分.同时采用高效的削减策略,大大提高了算法的效率.通过将算法与现有的以基因表达数据分析为目的的代表性投影聚类算法HARP相比较,证明提出算法的高效性和有效性.
高通量微陣列技術與手工錶型標定方式間的矛盾導緻瞭基因錶達數據的穫取與錶型確定間的不平衡.然而,已有的錶型區分方法大多是有鑑督的,併且通常忽略瞭基因間廣汎存在的相互作用,根據單箇基因的獨立區分能力劃分樣本錶型,選擇相關基因.從新的視角,基于投影聚類的思想,提齣一種攷慮基因間相互關繫的無鑑督錶型區分算法USPD.通過將基因錶達數據轉化為具有負間隔約束的序列數據,彊化瞭基因間的相互關繫.利用設計的質量函數,採用深度優先方式遍歷樣本窮舉樹,無鑑督地生成樣本錶型劃分.同時採用高效的削減策略,大大提高瞭算法的效率.通過將算法與現有的以基因錶達數據分析為目的的代錶性投影聚類算法HARP相比較,證明提齣算法的高效性和有效性.
고통량미진렬기술여수공표형표정방식간적모순도치료기인표체수거적획취여표형학정간적불평형.연이,이유적표형구분방법대다시유감독적,병차통상홀략료기인간엄범존재적상호작용,근거단개기인적독립구분능력화분양본표형,선택상관기인.종신적시각,기우투영취류적사상,제출일충고필기인간상호관계적무감독표형구분산법USPD.통과장기인표체수거전화위구유부간격약속적서렬수거,강화료기인간적상호관계.이용설계적질량함수,채용심도우선방식편력양본궁거수,무감독지생성양본표형화분.동시채용고효적삭감책략,대대제고료산법적효솔.통과장산법여현유적이기인표체수거분석위목적적대표성투영취류산법HARP상비교,증명제출산법적고효성화유효성.