数学的实践与认识
數學的實踐與認識
수학적실천여인식
MATHEMATICS IN PRACTICE AND THEORY
2013年
14期
85-93
,共9页
基因识别%3-周期性%局部阈值%移动序列信噪比曲线%方差均值
基因識彆%3-週期性%跼部閾值%移動序列信譟比麯線%方差均值
기인식별%3-주기성%국부역치%이동서렬신조비곡선%방차균치
Gene identification%3-peoriodcity%local threshold%moving sequence SNR curve%mean of variance
基因识别问题首要的工作是对数字化后的基因序列利用离散傅里叶变换(DFT)进行频谱分析.对于很长的DNA序列,功率谱或信噪比计算量很大,推导出了DNA序列在Voss映射、Z-curve映射和实数映射下的信噪比快速算法,以及在Voss映射与Z-curve映射下的信噪比的关系.针对阈值确定的问题提出了基于滑动窗口的局部阈值的算法,在分类时达到了很好的效果.另外,实现了基于移动序列信噪比曲线的基因识别方法.最后,由于DNA序列的3-周期性实际上反映了核苷酸在基因序列的三个子序列上分布的“非均衡性”,因此引入“方差均值”特征来衡量该非均衡性,提出了基于方差均值的单因素基因识别方法及以信噪比和方差均值作为特征向量,并设计多项式分类器的基因识别算法.
基因識彆問題首要的工作是對數字化後的基因序列利用離散傅裏葉變換(DFT)進行頻譜分析.對于很長的DNA序列,功率譜或信譟比計算量很大,推導齣瞭DNA序列在Voss映射、Z-curve映射和實數映射下的信譟比快速算法,以及在Voss映射與Z-curve映射下的信譟比的關繫.針對閾值確定的問題提齣瞭基于滑動窗口的跼部閾值的算法,在分類時達到瞭很好的效果.另外,實現瞭基于移動序列信譟比麯線的基因識彆方法.最後,由于DNA序列的3-週期性實際上反映瞭覈苷痠在基因序列的三箇子序列上分佈的“非均衡性”,因此引入“方差均值”特徵來衡量該非均衡性,提齣瞭基于方差均值的單因素基因識彆方法及以信譟比和方差均值作為特徵嚮量,併設計多項式分類器的基因識彆算法.
기인식별문제수요적공작시대수자화후적기인서렬이용리산부리협변환(DFT)진행빈보분석.대우흔장적DNA서렬,공솔보혹신조비계산량흔대,추도출료DNA서렬재Voss영사、Z-curve영사화실수영사하적신조비쾌속산법,이급재Voss영사여Z-curve영사하적신조비적관계.침대역치학정적문제제출료기우활동창구적국부역치적산법,재분류시체도료흔호적효과.령외,실현료기우이동서렬신조비곡선적기인식별방법.최후,유우DNA서렬적3-주기성실제상반영료핵감산재기인서렬적삼개자서렬상분포적“비균형성”,인차인입“방차균치”특정래형량해비균형성,제출료기우방차균치적단인소기인식별방법급이신조비화방차균치작위특정향량,병설계다항식분류기적기인식별산법.