计算机工程
計算機工程
계산궤공정
Computer Engineering
2015年
10期
265-269
,共5页
吕亚平%高戈%陈怡%张康
呂亞平%高戈%陳怡%張康
려아평%고과%진이%장강
人耳听觉系统%感知域音频编码%高斯混合模型%Gammatone滤波器组%高斯-牛顿算法
人耳聽覺繫統%感知域音頻編碼%高斯混閤模型%Gammatone濾波器組%高斯-牛頓算法
인이은각계통%감지역음빈편마%고사혼합모형%Gammatone려파기조%고사-우돈산법
human auditory system%perceptual domain audio coding%Gaussian Mixture Model (GMM)%Gammatone filter bank%Gauss-Newton algorithm
传统感知音频编码方案采用心理声学掩蔽降低编码码率,其声道模型+信号激励的方式难以同时实现高质量的中低码率语音和音频信号编码.为此,提出一种基于高斯混合模型的感知域音频编码方法,利用Gammatone滤波器组模拟人耳听觉系统,采用多路复用掩蔽模型替换降低包络脉冲的数量,对结构化模型进行拟合,使用高斯-牛顿算法对听觉包络进行高斯混合模型参数的拟合,将高斯混合模型参数替代音频信号特征.实验结果表明,与基于稀疏包络表示重构的音频编码方法相比,该方法的主观测试高0.5分~0.8分,客观测试高5分~10分,解码得到的语音和大部分音乐信号都能还原到原始音频信号,可用于实现高质量的中低码率语音和音频编码.
傳統感知音頻編碼方案採用心理聲學掩蔽降低編碼碼率,其聲道模型+信號激勵的方式難以同時實現高質量的中低碼率語音和音頻信號編碼.為此,提齣一種基于高斯混閤模型的感知域音頻編碼方法,利用Gammatone濾波器組模擬人耳聽覺繫統,採用多路複用掩蔽模型替換降低包絡脈遲的數量,對結構化模型進行擬閤,使用高斯-牛頓算法對聽覺包絡進行高斯混閤模型參數的擬閤,將高斯混閤模型參數替代音頻信號特徵.實驗結果錶明,與基于稀疏包絡錶示重構的音頻編碼方法相比,該方法的主觀測試高0.5分~0.8分,客觀測試高5分~10分,解碼得到的語音和大部分音樂信號都能還原到原始音頻信號,可用于實現高質量的中低碼率語音和音頻編碼.
전통감지음빈편마방안채용심리성학엄폐강저편마마솔,기성도모형+신호격려적방식난이동시실현고질량적중저마솔어음화음빈신호편마.위차,제출일충기우고사혼합모형적감지역음빈편마방법,이용Gammatone려파기조모의인이은각계통,채용다로복용엄폐모형체환강저포락맥충적수량,대결구화모형진행의합,사용고사-우돈산법대은각포락진행고사혼합모형삼수적의합,장고사혼합모형삼수체대음빈신호특정.실험결과표명,여기우희소포락표시중구적음빈편마방법상비,해방법적주관측시고0.5분~0.8분,객관측시고5분~10분,해마득도적어음화대부분음악신호도능환원도원시음빈신호,가용우실현고질량적중저마솔어음화음빈편마.