中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2004年
2期
36-43
,共8页
陈雁翔%戴蓓倩%周曦%李辉
陳雁翔%戴蓓倩%週晞%李輝
진안상%대배천%주희%리휘
计算机应用%中文信息处理%对话语音%GLR距离测度%无监督语音分割
計算機應用%中文信息處理%對話語音%GLR距離測度%無鑑督語音分割
계산궤응용%중문신식처리%대화어음%GLR거리측도%무감독어음분할
本文建立了一个基于对话语音的与文本无关的说话人确认系统,它和传统的与文本无关的说话人确认系统的关键不同在于,训练及测试语音不再只包含一个人而都是对话语音,因此需要分割出属于不同说话人的语音段,以建立说话人模型和实现最终判决.文中详细介绍了高斯混合模型-背景模型(GMM-UBM)这种说话人确认系统的框架,重点讨论了基于GLR(Generalized Likelihood Ratio)距离测度的无监督语音分割算法.最终阐述的输出评分的规整方法即ZNORM(Zero Normalization)和持续时间修正,可以使确认系统的性能提高近10%.
本文建立瞭一箇基于對話語音的與文本無關的說話人確認繫統,它和傳統的與文本無關的說話人確認繫統的關鍵不同在于,訓練及測試語音不再隻包含一箇人而都是對話語音,因此需要分割齣屬于不同說話人的語音段,以建立說話人模型和實現最終判決.文中詳細介紹瞭高斯混閤模型-揹景模型(GMM-UBM)這種說話人確認繫統的框架,重點討論瞭基于GLR(Generalized Likelihood Ratio)距離測度的無鑑督語音分割算法.最終闡述的輸齣評分的規整方法即ZNORM(Zero Normalization)和持續時間脩正,可以使確認繫統的性能提高近10%.
본문건립료일개기우대화어음적여문본무관적설화인학인계통,타화전통적여문본무관적설화인학인계통적관건불동재우,훈련급측시어음불재지포함일개인이도시대화어음,인차수요분할출속우불동설화인적어음단,이건립설화인모형화실현최종판결.문중상세개소료고사혼합모형-배경모형(GMM-UBM)저충설화인학인계통적광가,중점토론료기우GLR(Generalized Likelihood Ratio)거리측도적무감독어음분할산법.최종천술적수출평분적규정방법즉ZNORM(Zero Normalization)화지속시간수정,가이사학인계통적성능제고근10%.