天津大学学报
天津大學學報
천진대학학보
Journal of Tianjin University
2015年
9期
765-770
,共6页
张宇%计哲%万辛%张震%葛凤培%颜永红
張宇%計哲%萬辛%張震%葛鳳培%顏永紅
장우%계철%만신%장진%갈봉배%안영홍
声学模型自适应%语音识别%深度神经网络
聲學模型自適應%語音識彆%深度神經網絡
성학모형자괄응%어음식별%심도신경망락
acoustic model adaptation%speech recognition%deep neural network(DNN)
声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关的自动语音识别任务,对典型的两种声学模型自适应算法进行了尝试,实验了基于线性变换网络的自适应方法和基于相对熵正则化准则的自适应方法,并对两种算法进行了详尽的系统性能比较.结果表明,在不同的自适应数据量下,相对熵正则化自适应方法均能表现出较好的性能.
聲學模型自適應算法研究目的是緩解由測試數據和訓練數據不匹配而引起的識彆性能下降問題.基于深度神經網絡(DNN)模型框架的自適應技術中,重訓練是最直接的方法,但極容易齣現過擬閤現象,尤其是自適應數據稀疏的情況下.文章針對領域相關的自動語音識彆任務,對典型的兩種聲學模型自適應算法進行瞭嘗試,實驗瞭基于線性變換網絡的自適應方法和基于相對熵正則化準則的自適應方法,併對兩種算法進行瞭詳儘的繫統性能比較.結果錶明,在不同的自適應數據量下,相對熵正則化自適應方法均能錶現齣較好的性能.
성학모형자괄응산법연구목적시완해유측시수거화훈련수거불필배이인기적식별성능하강문제.기우심도신경망락(DNN)모형광가적자괄응기술중,중훈련시최직접적방법,단겁용역출현과의합현상,우기시자괄응수거희소적정황하.문장침대영역상관적자동어음식별임무,대전형적량충성학모형자괄응산법진행료상시,실험료기우선성변환망락적자괄응방법화기우상대적정칙화준칙적자괄응방법,병대량충산법진행료상진적계통성능비교.결과표명,재불동적자괄응수거량하,상대적정칙화자괄응방법균능표현출교호적성능.
Acoustic model adaptation algorithmaims at reducing the recognition performance degradation caused by the mismatch between training and testing data.Among the many adaptation techniques based on deep neural net-work(DNN),retraining is the most straightforward way.However it is prone to over-fitting,especially when adap-tation data is sparse.In this paper,two typical acoustic adaptation methods,namely linear transformation network adaptation and Kullback-Leibler divergence regularization adaptation,are experimentally explored for task-adaptation purpose.An elaborate comparison is made,and results show that KL divergence regularization technique achieves better performance under different amounts of adaptation data.