电子学报
電子學報
전자학보
ACTA ELECTRONICA SINICA
2010年
7期
1574-1579
,共6页
语音编码%波形内插%特征波形%二维非负矩阵分解%两帧联合
語音編碼%波形內插%特徵波形%二維非負矩陣分解%兩幀聯閤
어음편마%파형내삽%특정파형%이유비부구진분해%량정연합
本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法.文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化.此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音.本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质.非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法.
本文針對波形內插(WI)語音編碼模型和參數量化等技術進行瞭研究,併最終提齣瞭一種基于二維非負矩陣分解的1kb/s波形內插(2DNMF-WI)語音編碼算法.文中採用二維非負矩陣分解(2D-NMF)方法來分解語音特徵波形(CW),該分解方法在行和列兩箇方嚮上同時壓縮CW幅度譜矩陣的維數,使得CW幅度譜矩陣降維後得到的編碼矩陣維數較小,易于量化.此外,在甚低速率語音編碼中,由于沒有足夠的比特數來描述編碼參數,往往很難得到高質量的閤成語音.本算法採用兩幀聯閤編碼、幀間後嚮預測三級矢量量化、離散餘絃變換(DCT)和分裂式矩陣量化等技術來降低編碼速率和改善音質.非正式主觀聽覺測試顯示,1kb/s 2DNMF-WI編碼器閤成語音的質量稍差于2kb/s的NMF-WI語音編碼算法.
본문침대파형내삽(WI)어음편마모형화삼수양화등기술진행료연구,병최종제출료일충기우이유비부구진분해적1kb/s파형내삽(2DNMF-WI)어음편마산법.문중채용이유비부구진분해(2D-NMF)방법래분해어음특정파형(CW),해분해방법재행화렬량개방향상동시압축CW폭도보구진적유수,사득CW폭도보구진강유후득도적편마구진유수교소,역우양화.차외,재심저속솔어음편마중,유우몰유족구적비특수래묘술편마삼수,왕왕흔난득도고질량적합성어음.본산법채용량정연합편마、정간후향예측삼급시량양화、리산여현변환(DCT)화분렬식구진양화등기술래강저편마속솔화개선음질.비정식주관은각측시현시,1kb/s 2DNMF-WI편마기합성어음적질량초차우2kb/s적NMF-WI어음편마산법.