计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2014年
5期
155-158,176
,共5页
王美华%苏雄斌%蔡瑞初%罗静
王美華%囌雄斌%蔡瑞初%囉靜
왕미화%소웅빈%채서초%라정
关联规则%基因表达数据%支持向量机%疾病辅助诊断
關聯規則%基因錶達數據%支持嚮量機%疾病輔助診斷
관련규칙%기인표체수거%지지향량궤%질병보조진단
Association rules%Gene expression data%Support vector machine%Computer aided diseases diagnoses
通过研究基因表达数据发现与特定疾病相关的关联规则,对疾病辅助诊断有重要的意义。针对现有分类结果可解释性的不足,提出一种基于关联规则的基因表达数据分类模型ASSO-SVM(ASSOciation rule based Support Vector Machine)。在该模型中,关联规则作为一种特征选择方法,用于提取基因之间的非线性关联。通过这些非线性关联所获取的先验知识有利于提高分类结果的可解释性。另外,针对基因表达数据高维、小样本的特性,该方法采用支持向量机作为对基因表达数据的分类器,获得较高的分类精度。ASSO-SVM结合了基因表达关联规则以及支持向量机分类的优点。在实际基因表达数据集上与现有分类模型的对比实验验证了该方法的有效性。
通過研究基因錶達數據髮現與特定疾病相關的關聯規則,對疾病輔助診斷有重要的意義。針對現有分類結果可解釋性的不足,提齣一種基于關聯規則的基因錶達數據分類模型ASSO-SVM(ASSOciation rule based Support Vector Machine)。在該模型中,關聯規則作為一種特徵選擇方法,用于提取基因之間的非線性關聯。通過這些非線性關聯所穫取的先驗知識有利于提高分類結果的可解釋性。另外,針對基因錶達數據高維、小樣本的特性,該方法採用支持嚮量機作為對基因錶達數據的分類器,穫得較高的分類精度。ASSO-SVM結閤瞭基因錶達關聯規則以及支持嚮量機分類的優點。在實際基因錶達數據集上與現有分類模型的對比實驗驗證瞭該方法的有效性。
통과연구기인표체수거발현여특정질병상관적관련규칙,대질병보조진단유중요적의의。침대현유분류결과가해석성적불족,제출일충기우관련규칙적기인표체수거분류모형ASSO-SVM(ASSOciation rule based Support Vector Machine)。재해모형중,관련규칙작위일충특정선택방법,용우제취기인지간적비선성관련。통과저사비선성관련소획취적선험지식유리우제고분류결과적가해석성。령외,침대기인표체수거고유、소양본적특성,해방법채용지지향량궤작위대기인표체수거적분류기,획득교고적분류정도。ASSO-SVM결합료기인표체관련규칙이급지지향량궤분류적우점。재실제기인표체수거집상여현유분류모형적대비실험험증료해방법적유효성。
The discovery of association rules correlated to specific diseases through studying the gene expression data is of great importance to the computer aided diseases diagnoses.Here we propose an association rule-based gene expression data classification model (ASSO-SVM) aiming at the deficiency of interpretability in existing classification results.In this model,association rules are used as a kind of feature selection approach to extract the nonlinear associations among the genes.The priori knowledge acquired by these nonlinear associations benefits the improvement on interpretability of the classification results.Besides,in light of the features of high dimensionality and small sample of the gene expression data,the method uses support vector machine as the classifier for gene expression data to achieve higher classification accuracy.The ASSO-SVM combines the advantages of the gene expressive association rules and the SVM classification.Contrastive experiment on practical gene expression datasets in comparison with existing classification model verifies the effectiveness of the method.