信号处理
信號處理
신호처리
SIGNAL PROCESSING
2012年
3期
344-351
,共8页
孙新建%张雄伟%杨吉斌%曹铁勇%孙健
孫新建%張雄偉%楊吉斌%曹鐵勇%孫健
손신건%장웅위%양길빈%조철용%손건
语音转换%隐变量模型%内容与形式%分离%形式替换
語音轉換%隱變量模型%內容與形式%分離%形式替換
어음전환%은변량모형%내용여형식%분리%형식체환
传统语音转换方法利用说话人声音特征映射实现,容易造成过平滑(over-smoothing)和过拟合(over-fitting)问题.本文从语音信号内容与形式分离角度,利用隐变量模型提出了一种全新的语音转换方法.首先利用包含两个隐变量因子的隐变量模型(Latent Variable Model,LVM)建立语音信号的生成模型;然后采用最大似然方法把语音信号分解成表示语义的内容信息和体现说话人特征的形式信息,并估计出模型参数;最后基于LVM生成模型,利用说话人形式替换方法实现语音转换.主、客观测试结果表明,在相同训练集条件下,本文提出的语音转换方法性能明显优于GMM方法,并且隐变量模型和传统的双线性模型(Bilinear Model)相比,由于采用非线性关系描述内容与形式之间的相互作用,因此分离效果更好,语音转换质量更高.
傳統語音轉換方法利用說話人聲音特徵映射實現,容易造成過平滑(over-smoothing)和過擬閤(over-fitting)問題.本文從語音信號內容與形式分離角度,利用隱變量模型提齣瞭一種全新的語音轉換方法.首先利用包含兩箇隱變量因子的隱變量模型(Latent Variable Model,LVM)建立語音信號的生成模型;然後採用最大似然方法把語音信號分解成錶示語義的內容信息和體現說話人特徵的形式信息,併估計齣模型參數;最後基于LVM生成模型,利用說話人形式替換方法實現語音轉換.主、客觀測試結果錶明,在相同訓練集條件下,本文提齣的語音轉換方法性能明顯優于GMM方法,併且隱變量模型和傳統的雙線性模型(Bilinear Model)相比,由于採用非線性關繫描述內容與形式之間的相互作用,因此分離效果更好,語音轉換質量更高.
전통어음전환방법이용설화인성음특정영사실현,용역조성과평활(over-smoothing)화과의합(over-fitting)문제.본문종어음신호내용여형식분리각도,이용은변량모형제출료일충전신적어음전환방법.수선이용포함량개은변량인자적은변량모형(Latent Variable Model,LVM)건립어음신호적생성모형;연후채용최대사연방법파어음신호분해성표시어의적내용신식화체현설화인특정적형식신식,병고계출모형삼수;최후기우LVM생성모형,이용설화인형식체환방법실현어음전환.주、객관측시결과표명,재상동훈련집조건하,본문제출적어음전환방법성능명현우우GMM방법,병차은변량모형화전통적쌍선성모형(Bilinear Model)상비,유우채용비선성관계묘술내용여형식지간적상호작용,인차분리효과경호,어음전환질량경고.