生物信息学
生物信息學
생물신식학
BIOINFORMATICS
2004年
3期
19-22
,共4页
吕飒丽%汪强虎%李霞%郭政
呂颯麗%汪彊虎%李霞%郭政
려삽려%왕강호%리하%곽정
BOOTSTRAP%决策森林%人工神经网络%特征基因
BOOTSTRAP%決策森林%人工神經網絡%特徵基因
BOOTSTRAP%결책삼림%인공신경망락%특정기인
应用DNA芯片可获得成千上万个基因的表达谱数据.寻找对疾病有鉴别力的特征基因,滤掉与疾病无关的基因是基因表达谱数据分析的的关键问题.利用决策森林方法的集成优势,提出基于决策森林的两种特征基因识别方法.该方法先由决策森林按照一定的显著性水平滤掉大部分与疾病类别无关的基因,然后采用统计频数法和扰动法,根据所选特征对分类的贡献程度对初选的特征基因作更加精细地选择.最后,选用神经网络作为外部分类器对所选的特征基因子集进行评价,将提出的方法应用于40例结肠癌组织与22例正常组织中2000个基因的表达谱实验数据.结果表明:上述两种方法选出的特征基因均具有较高的疾病鉴别能力,均可获得最优特征基因子集,基于决策森林的统计频数法优于扰动法.
應用DNA芯片可穫得成韆上萬箇基因的錶達譜數據.尋找對疾病有鑒彆力的特徵基因,濾掉與疾病無關的基因是基因錶達譜數據分析的的關鍵問題.利用決策森林方法的集成優勢,提齣基于決策森林的兩種特徵基因識彆方法.該方法先由決策森林按照一定的顯著性水平濾掉大部分與疾病類彆無關的基因,然後採用統計頻數法和擾動法,根據所選特徵對分類的貢獻程度對初選的特徵基因作更加精細地選擇.最後,選用神經網絡作為外部分類器對所選的特徵基因子集進行評價,將提齣的方法應用于40例結腸癌組織與22例正常組織中2000箇基因的錶達譜實驗數據.結果錶明:上述兩種方法選齣的特徵基因均具有較高的疾病鑒彆能力,均可穫得最優特徵基因子集,基于決策森林的統計頻數法優于擾動法.
응용DNA심편가획득성천상만개기인적표체보수거.심조대질병유감별력적특정기인,려도여질병무관적기인시기인표체보수거분석적적관건문제.이용결책삼림방법적집성우세,제출기우결책삼림적량충특정기인식별방법.해방법선유결책삼림안조일정적현저성수평려도대부분여질병유별무관적기인,연후채용통계빈수법화우동법,근거소선특정대분류적공헌정도대초선적특정기인작경가정세지선택.최후,선용신경망락작위외부분류기대소선적특정기인자집진행평개,장제출적방법응용우40례결장암조직여22례정상조직중2000개기인적표체보실험수거.결과표명:상술량충방법선출적특정기인균구유교고적질병감별능력,균가획득최우특정기인자집,기우결책삼림적통계빈수법우우우동법.