CAJ | 학술논문

传统感知音频编码方案采用心理声学掩蔽降低编码码率,其声道模型+信号激励的方式难以同时实现高质量的中低码率语音和音频信号编码.为此,提出一种基于高斯混合模型的感知域音频编码方法,利用Gammatone滤波器组模拟人耳听觉系统,采用多路复用掩蔽模型替换降低包络脉冲的数量,对结构化模型进行拟合,使用高斯-牛顿算法对听觉包络进行高斯混合模型参数的拟合,将高斯混合模型参数替代音频信号特征.实验结果表明,与基于稀疏包络表示重构的音频编码方法相比,该方法的主观测试高0.5分～0.8分,客观测试高5分～10分,解码得到的语音和大部分音乐信号都能还原到原始音频信号,可用于实现高质量的中低码率语音和音频编码.
전통감지음빈편마방안채용심리성학엄폐강저편마마솔,기성도모형+신호격려적방식난이동시실현고질량적중저마솔어음화음빈신호편마.위차,제출일충기우고사혼합모형적감지역음빈편마방법,이용Gammatone려파기조모의인이은각계통,채용다로복용엄폐모형체환강저포락맥충적수량,대결구화모형진행의합,사용고사-우돈산법대은각포락진행고사혼합모형삼수적의합,장고사혼합모형삼수체대음빈신호특정.실험결과표명,여기우희소포락표시중구적음빈편마방법상비,해방법적주관측시고0.5분～0.8분,객관측시고5분～10분,해마득도적어음화대부분음악신호도능환원도원시음빈신호,가용우실현고질량적중저마솔어음화음빈편마.