小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2006年
3期
497-502
,共6页
郑若石%王镝%徐恒宇%王国仁%陈白尘
鄭若石%王鏑%徐恆宇%王國仁%陳白塵
정약석%왕적%서항우%왕국인%진백진
序列相似性查询%范围查%K近邻查询%生物信息学
序列相似性查詢%範圍查%K近鄰查詢%生物信息學
서렬상사성사순%범위사%K근린사순%생물신식학
随着基因测序技术和人类基因组计划的发展,从大量的生物数据中寻找相似的序列就越来越成为当前研究的热点问题.本文提出了一种聚类的多解析度字符串索引结构,用于解决生物序列的相似性查询问题.首先,以较小容量的MBR(最小绑定矩形)构造基因序列的多解析度字符串索引结构,然后通过对MBR的聚类以及保序技术的应用,减小索引中MBR的平均体积,从而增加了查询向量到索引的空间距离,提高了索引的过滤能力.还给出了一种新的后处理方法,通过大量的减少编辑距离的计算,提高索引的性能.文中给出了该索引结构并详细介绍了索引的相关算法.实验表明,该索引结构是一种有效的处理生物数据的相似性查询的索引结构.
隨著基因測序技術和人類基因組計劃的髮展,從大量的生物數據中尋找相似的序列就越來越成為噹前研究的熱點問題.本文提齣瞭一種聚類的多解析度字符串索引結構,用于解決生物序列的相似性查詢問題.首先,以較小容量的MBR(最小綁定矩形)構造基因序列的多解析度字符串索引結構,然後通過對MBR的聚類以及保序技術的應用,減小索引中MBR的平均體積,從而增加瞭查詢嚮量到索引的空間距離,提高瞭索引的過濾能力.還給齣瞭一種新的後處理方法,通過大量的減少編輯距離的計算,提高索引的性能.文中給齣瞭該索引結構併詳細介紹瞭索引的相關算法.實驗錶明,該索引結構是一種有效的處理生物數據的相似性查詢的索引結構.
수착기인측서기술화인류기인조계화적발전,종대량적생물수거중심조상사적서렬취월래월성위당전연구적열점문제.본문제출료일충취류적다해석도자부천색인결구,용우해결생물서렬적상사성사순문제.수선,이교소용량적MBR(최소방정구형)구조기인서렬적다해석도자부천색인결구,연후통과대MBR적취류이급보서기술적응용,감소색인중MBR적평균체적,종이증가료사순향량도색인적공간거리,제고료색인적과려능력.환급출료일충신적후처리방법,통과대량적감소편집거리적계산,제고색인적성능.문중급출료해색인결구병상세개소료색인적상관산법.실험표명,해색인결구시일충유효적처리생물수거적상사성사순적색인결구.