电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2014年
22期
5220-5222
,共3页
模糊C均值%特征片段%系统开发
模糊C均值%特徵片段%繫統開髮
모호C균치%특정편단%계통개발
20世纪90年代,人类基因组计划的启动,有力推动了DNA测序工作的发展。寻找某些特征片段(功能片段)在序列中的分布规律,对遗传学、生物信息学等都有重要的应用意义。在教学、研究中发现,应用数学分析软件MATLAB的字符串处理功能,可以容易地达到功能片段分析的目的,本系统通过分析DNA序列链之间的关联程度,构造出特征矩阵,根据模糊C均值算法较准确的对DNA序列的集合进行了分类,同时利用matlab的图像显示功能将聚类的最终结果清楚明了的显示在图像中,使用户能清楚的看到聚类效果。本系统主要研究了DNA链碱基序列分析、多个DNA链特征矩阵提取、模糊C均值聚类算法分类DNA等三大部分。首先该系统对DNA序列的总长度和功能序列的长度进行了测量,利用一维数组确定功能片段在DNA序列中的位置特征,从而完成了对DNA碱基序列的分析;其次该系统对用户给出的数个DNA链进行序列之间的特征分析,统计出每个序列的(A,T,C,G)碱基密度,得到一个特征矩阵,有效的为模糊聚类分析方法提供数据来源。最终该系统应用模糊C均值聚类算法,利用特征矩阵的数值,将数个DNA序列聚类并分为两类。
20世紀90年代,人類基因組計劃的啟動,有力推動瞭DNA測序工作的髮展。尋找某些特徵片段(功能片段)在序列中的分佈規律,對遺傳學、生物信息學等都有重要的應用意義。在教學、研究中髮現,應用數學分析軟件MATLAB的字符串處理功能,可以容易地達到功能片段分析的目的,本繫統通過分析DNA序列鏈之間的關聯程度,構造齣特徵矩陣,根據模糊C均值算法較準確的對DNA序列的集閤進行瞭分類,同時利用matlab的圖像顯示功能將聚類的最終結果清楚明瞭的顯示在圖像中,使用戶能清楚的看到聚類效果。本繫統主要研究瞭DNA鏈堿基序列分析、多箇DNA鏈特徵矩陣提取、模糊C均值聚類算法分類DNA等三大部分。首先該繫統對DNA序列的總長度和功能序列的長度進行瞭測量,利用一維數組確定功能片段在DNA序列中的位置特徵,從而完成瞭對DNA堿基序列的分析;其次該繫統對用戶給齣的數箇DNA鏈進行序列之間的特徵分析,統計齣每箇序列的(A,T,C,G)堿基密度,得到一箇特徵矩陣,有效的為模糊聚類分析方法提供數據來源。最終該繫統應用模糊C均值聚類算法,利用特徵矩陣的數值,將數箇DNA序列聚類併分為兩類。
20세기90년대,인류기인조계화적계동,유력추동료DNA측서공작적발전。심조모사특정편단(공능편단)재서렬중적분포규률,대유전학、생물신식학등도유중요적응용의의。재교학、연구중발현,응용수학분석연건MATLAB적자부천처리공능,가이용역지체도공능편단분석적목적,본계통통과분석DNA서렬련지간적관련정도,구조출특정구진,근거모호C균치산법교준학적대DNA서렬적집합진행료분류,동시이용matlab적도상현시공능장취류적최종결과청초명료적현시재도상중,사용호능청초적간도취류효과。본계통주요연구료DNA련감기서렬분석、다개DNA련특정구진제취、모호C균치취류산법분류DNA등삼대부분。수선해계통대DNA서렬적총장도화공능서렬적장도진행료측량,이용일유수조학정공능편단재DNA서렬중적위치특정,종이완성료대DNA감기서렬적분석;기차해계통대용호급출적수개DNA련진행서렬지간적특정분석,통계출매개서렬적(A,T,C,G)감기밀도,득도일개특정구진,유효적위모호취류분석방법제공수거래원。최종해계통응용모호C균치취류산법,이용특정구진적수치,장수개DNA서렬취류병분위량류。