工程科学学报
工程科學學報
공정과학학보
Journal of University of Science and Technology Beijing
2015年
9期
1212-1217
,共6页
张晴晴%刘勇%潘接林%颜永红
張晴晴%劉勇%潘接林%顏永紅
장청청%류용%반접림%안영홍
卷积神经网络%连续语音识别%权值共享%聚合%泛化性
捲積神經網絡%連續語音識彆%權值共享%聚閤%汎化性
권적신경망락%련속어음식별%권치공향%취합%범화성
convolutional neural networks%continuous speech recognition%weight sharing%pooling%generalization
在语音识别中,卷积神经网络( convolutional neural networks,CNNs)相比于目前广泛使用的深层神经网络( deep neural network,DNNs),能在保证性能的同时,大大压缩模型的尺寸。本文深入分析了卷积神经网络中卷积层和聚合层的不同结构对识别性能的影响情况,并与目前广泛使用的深层神经网络模型进行了对比。在标准语音识别库TIMIT以及大词表非特定人电话自然口语对话数据库上的实验结果证明,相比传统深层神经网络模型,卷积神经网络明显降低模型规模的同时,识别性能更好,且泛化能力更强。
在語音識彆中,捲積神經網絡( convolutional neural networks,CNNs)相比于目前廣汎使用的深層神經網絡( deep neural network,DNNs),能在保證性能的同時,大大壓縮模型的呎吋。本文深入分析瞭捲積神經網絡中捲積層和聚閤層的不同結構對識彆性能的影響情況,併與目前廣汎使用的深層神經網絡模型進行瞭對比。在標準語音識彆庫TIMIT以及大詞錶非特定人電話自然口語對話數據庫上的實驗結果證明,相比傳統深層神經網絡模型,捲積神經網絡明顯降低模型規模的同時,識彆性能更好,且汎化能力更彊。
재어음식별중,권적신경망락( convolutional neural networks,CNNs)상비우목전엄범사용적심층신경망락( deep neural network,DNNs),능재보증성능적동시,대대압축모형적척촌。본문심입분석료권적신경망락중권적층화취합층적불동결구대식별성능적영향정황,병여목전엄범사용적심층신경망락모형진행료대비。재표준어음식별고TIMIT이급대사표비특정인전화자연구어대화수거고상적실험결과증명,상비전통심층신경망락모형,권적신경망락명현강저모형규모적동시,식별성능경호,차범화능력경강。
Convolutional neural networks ( CNNs ) , which show success in achieving translation invariance for many image processing tasks, were investigated for continuous speech recognition. Compared to deep neural networks ( DNNs) , which are proven to be successful in many speech recognition tasks nowadays, CNNs can reduce the neural network model sizes significantly, and at the same time achieve even a better recognition accuracy. Experiments on standard speech corpus TIMIT and conversational speech corpus show that CNNs outperform DNNs in terms of the accuracy and the generalization ability.