CAJ | 학술논문

压缩域说话人识别算法(Compressed-domain automatic speaker recognition,CD-ASR)即从压缩语音数据中直接提取压缩参数进行说话人识别,无需参数译码和波形合成.本文提出了基于概率统计直方图的VoIP压缩域说话人识别算法,包括矢量量化统计直方图和高斯混合模型统计直方图两种方法.在给出了G.729,G.723.1(6.3 kb/s),G.723.1(5.3 kb/s)压缩码流的压缩域特征提取方案后,分别以矢量量化统计直方图和高斯混合模型统计直方图作为识别模型进行说话人识别.实验结果表明,概率统计直方图法比在压缩码漉中提取同样识别参数的GMM模型,识别率有很大提高.
압축역설화인식별산법(Compressed-domain automatic speaker recognition,CD-ASR)즉종압축어음수거중직접제취압축삼수진행설화인식별,무수삼수역마화파형합성.본문제출료기우개솔통계직방도적VoIP압축역설화인식별산법,포괄시량양화통계직방도화고사혼합모형통계직방도량충방법.재급출료G.729,G.723.1(6.3 kb/s),G.723.1(5.3 kb/s)압축마류적압축역특정제취방안후,분별이시량양화통계직방도화고사혼합모형통계직방도작위식별모형진행설화인식별.실험결과표명,개솔통계직방도법비재압축마록중제취동양식별삼수적GMM모형,식별솔유흔대제고.