计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2013年
11期
76-79
,共4页
彭玉青%高洁%梁春娟%李铁军
彭玉青%高潔%樑春娟%李鐵軍
팽옥청%고길%량춘연%리철군
图像可听化%视觉特征%特征级融合%遗传算法%BP神经网络
圖像可聽化%視覺特徵%特徵級融閤%遺傳算法%BP神經網絡
도상가은화%시각특정%특정급융합%유전산법%BP신경망락
Image sonification%Visual characteristics%Feature-level fusion%Genetic algorithm%BP neural network
在传统的视听双模态语音识别系统的研究中,经图像处理后的视觉特征往往具有数据量大、重要特征丢失等问题。针对这些问题,拟采用图像可听化技术对视频图像进行特征提取。以遗传算法优化的BP神经网络为融合模型,对视频、音频特征进行特征级融合。实验结果表明,经过图像可听化处理后视觉特征包含了一定的语音信息,在噪声环境下的识别效果比较稳定,神经网络的融合模型提高了系统的鲁棒性。
在傳統的視聽雙模態語音識彆繫統的研究中,經圖像處理後的視覺特徵往往具有數據量大、重要特徵丟失等問題。針對這些問題,擬採用圖像可聽化技術對視頻圖像進行特徵提取。以遺傳算法優化的BP神經網絡為融閤模型,對視頻、音頻特徵進行特徵級融閤。實驗結果錶明,經過圖像可聽化處理後視覺特徵包含瞭一定的語音信息,在譟聲環境下的識彆效果比較穩定,神經網絡的融閤模型提高瞭繫統的魯棒性。
재전통적시은쌍모태어음식별계통적연구중,경도상처리후적시각특정왕왕구유수거량대、중요특정주실등문제。침대저사문제,의채용도상가은화기술대시빈도상진행특정제취。이유전산법우화적BP신경망락위융합모형,대시빈、음빈특정진행특정급융합。실험결과표명,경과도상가은화처리후시각특정포함료일정적어음신식,재조성배경하적식별효과비교은정,신경망락적융합모형제고료계통적로봉성。
While studying the traditional speech recognition system with audio-video dual mode , we found that the visual characteristics after image processing have the problems of large amount of data and important characteristics lost .Aiming at these problems , we plan to apply image sonification technology to extracting the characteristics of video image .By using BP neural network in genetic algorithm optimisation as the fusion model , we fuse the characteristics of audio and video at feature level .Experimental results show that , after being processed by the image sonification , the visual characteristics contain certain speech information , its recognition effect is stable in noise environment as well .The fusion model of neural network improves the robustness of the system .