数据采集与处理
數據採集與處理
수거채집여처리
JOURNAL OF DATA ACQUISITION & PROCESSING
2009年
5期
594-599
,共6页
屈丹%闫红刚%唐晖%王炳锡
屈丹%閆紅剛%唐暉%王炳錫
굴단%염홍강%당휘%왕병석
压缩域说话人识别%矢量量化概率统计直方图%高斯混合模型概率统计直方图
壓縮域說話人識彆%矢量量化概率統計直方圖%高斯混閤模型概率統計直方圖
압축역설화인식별%시량양화개솔통계직방도%고사혼합모형개솔통계직방도
压缩域说话人识别算法(Compressed-domain automatic speaker recognition,CD-ASR)即从压缩语音数据中直接提取压缩参数进行说话人识别,无需参数译码和波形合成.本文提出了基于概率统计直方图的VoIP压缩域说话人识别算法,包括矢量量化统计直方图和高斯混合模型统计直方图两种方法.在给出了G.729,G.723.1(6.3 kb/s),G.723.1(5.3 kb/s)压缩码流的压缩域特征提取方案后,分别以矢量量化统计直方图和高斯混合模型统计直方图作为识别模型进行说话人识别.实验结果表明,概率统计直方图法比在压缩码漉中提取同样识别参数的GMM模型,识别率有很大提高.
壓縮域說話人識彆算法(Compressed-domain automatic speaker recognition,CD-ASR)即從壓縮語音數據中直接提取壓縮參數進行說話人識彆,無需參數譯碼和波形閤成.本文提齣瞭基于概率統計直方圖的VoIP壓縮域說話人識彆算法,包括矢量量化統計直方圖和高斯混閤模型統計直方圖兩種方法.在給齣瞭G.729,G.723.1(6.3 kb/s),G.723.1(5.3 kb/s)壓縮碼流的壓縮域特徵提取方案後,分彆以矢量量化統計直方圖和高斯混閤模型統計直方圖作為識彆模型進行說話人識彆.實驗結果錶明,概率統計直方圖法比在壓縮碼漉中提取同樣識彆參數的GMM模型,識彆率有很大提高.
압축역설화인식별산법(Compressed-domain automatic speaker recognition,CD-ASR)즉종압축어음수거중직접제취압축삼수진행설화인식별,무수삼수역마화파형합성.본문제출료기우개솔통계직방도적VoIP압축역설화인식별산법,포괄시량양화통계직방도화고사혼합모형통계직방도량충방법.재급출료G.729,G.723.1(6.3 kb/s),G.723.1(5.3 kb/s)압축마류적압축역특정제취방안후,분별이시량양화통계직방도화고사혼합모형통계직방도작위식별모형진행설화인식별.실험결과표명,개솔통계직방도법비재압축마록중제취동양식별삼수적GMM모형,식별솔유흔대제고.