计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2005年
9期
170-175
,共6页
HMM%DTW%MFCC%观测向量%置信度评估%自适应反馈学习
HMM%DTW%MFCC%觀測嚮量%置信度評估%自適應反饋學習
HMM%DTW%MFCC%관측향량%치신도평고%자괄응반궤학습
本文通过对小训练样本集的基于DTW结构的数字语音识别模型的比较性分析,指出其存在的三个一般性问题:(1)DTW逐帧匹配模式割裂了观测向量序列的内在联系;(2)压扩观测向量序列造成局部信息使用的不均匀;(3)计算复杂度高,识别率低.为了解决这些问题,我们提出了基于数字语音时频信息整体结构的单特征向量识别模型.这种模型完整地利用了观测向量序列的全部信息,结合置信度评估和自适应反馈学习之后可及时地吸收测试向量携带的新的环境特征信息,调整识别模型结构.该模型的错识率较之最好的基于DTW结构的混合域模型的错识率降低50%以上,计算复杂度则是固定帧长模型的13.12%.
本文通過對小訓練樣本集的基于DTW結構的數字語音識彆模型的比較性分析,指齣其存在的三箇一般性問題:(1)DTW逐幀匹配模式割裂瞭觀測嚮量序列的內在聯繫;(2)壓擴觀測嚮量序列造成跼部信息使用的不均勻;(3)計算複雜度高,識彆率低.為瞭解決這些問題,我們提齣瞭基于數字語音時頻信息整體結構的單特徵嚮量識彆模型.這種模型完整地利用瞭觀測嚮量序列的全部信息,結閤置信度評估和自適應反饋學習之後可及時地吸收測試嚮量攜帶的新的環境特徵信息,調整識彆模型結構.該模型的錯識率較之最好的基于DTW結構的混閤域模型的錯識率降低50%以上,計算複雜度則是固定幀長模型的13.12%.
본문통과대소훈련양본집적기우DTW결구적수자어음식별모형적비교성분석,지출기존재적삼개일반성문제:(1)DTW축정필배모식할렬료관측향량서렬적내재련계;(2)압확관측향량서렬조성국부신식사용적불균균;(3)계산복잡도고,식별솔저.위료해결저사문제,아문제출료기우수자어음시빈신식정체결구적단특정향량식별모형.저충모형완정지이용료관측향량서렬적전부신식,결합치신도평고화자괄응반궤학습지후가급시지흡수측시향량휴대적신적배경특정신식,조정식별모형결구.해모형적착식솔교지최호적기우DTW결구적혼합역모형적착식솔강저50%이상,계산복잡도칙시고정정장모형적13.12%.