合肥工业大学学报(自然科学版)
閤肥工業大學學報(自然科學版)
합비공업대학학보(자연과학판)
JOURNAL OF HEFEI UNIVERSITY OF TECHNOLOGY(NATURAL SCIENCE)
2014年
8期
933-937
,共5页
王洪波%荣岩%罗贺%王晓佳
王洪波%榮巖%囉賀%王曉佳
왕홍파%영암%라하%왕효가
流形学习%DNA序列数据挖掘%5DLLE方法%DNA序列表示
流形學習%DNA序列數據挖掘%5DLLE方法%DNA序列錶示
류형학습%DNA서렬수거알굴%5DLLE방법%DNA서렬표시
manifold learning%DNA sequence data mining%5D locally linear embedding (5DLLE ) method%DNA sequence representation
由于人类DNA序列上单核苷酸具有多态性,DNA序列异常挖掘是后基因组时代的一个重要研究课题。文章在分析现有DNA序列数据挖掘方法的基础上,利用流形学习中不同低维嵌入向量之间向量距离不同的特点,提出了基于流形学习的DNA序列数据挖掘方法(5D locally linear embedding ,简称5DLLE)。实验结果表明,与隐马尔可夫模型(HMM)和支持向量机(SVM)相比,文中所提出的5DLLE方法在DNA序列数据挖掘方面具有一定优势,不但平均识别率高,而且计算时间相对较少。
由于人類DNA序列上單覈苷痠具有多態性,DNA序列異常挖掘是後基因組時代的一箇重要研究課題。文章在分析現有DNA序列數據挖掘方法的基礎上,利用流形學習中不同低維嵌入嚮量之間嚮量距離不同的特點,提齣瞭基于流形學習的DNA序列數據挖掘方法(5D locally linear embedding ,簡稱5DLLE)。實驗結果錶明,與隱馬爾可伕模型(HMM)和支持嚮量機(SVM)相比,文中所提齣的5DLLE方法在DNA序列數據挖掘方麵具有一定優勢,不但平均識彆率高,而且計算時間相對較少。
유우인류DNA서렬상단핵감산구유다태성,DNA서렬이상알굴시후기인조시대적일개중요연구과제。문장재분석현유DNA서렬수거알굴방법적기출상,이용류형학습중불동저유감입향량지간향량거리불동적특점,제출료기우류형학습적DNA서렬수거알굴방법(5D locally linear embedding ,간칭5DLLE)。실험결과표명,여은마이가부모형(HMM)화지지향량궤(SVM)상비,문중소제출적5DLLE방법재DNA서렬수거알굴방면구유일정우세,불단평균식별솔고,이차계산시간상대교소。
For the polymorphisms of single nucleotide on human DNA sequence ,it is important to re-search DNA sequence outlier mining in the post-genome era .In this paper ,based on the analysis of the existing DNA sequence data mining methods ,and by utilizing the characteristic that vector dis-tances between different low-dimensional embedding vectors are different in manifold learning ,a DNA sequence data mining method based on manifold learning ,i .e .5D locally linear embedding (5DLLE) method is proposed .The experimental results show that ,comparing with the hidden Markov model (HMM) and support vector machine(SVM) ,the proposed 5DLLE method possesses some advantages in DNA sequence data mining ,including higher average recognition rate and relatively less calculation time .