计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
1期
100-104
,共5页
双层码本%视觉语音合成%视觉语音特征%语音特征
雙層碼本%視覺語音閤成%視覺語音特徵%語音特徵
쌍층마본%시각어음합성%시각어음특정%어음특정
Bi-level codebook%Visual speech synthesis%Visual speech feature%Speech feature
提出了一种基于双层码本的语音驱动视觉语音合成系统,该系统以矢量量化的思想为基础,建立语音特征空间到视觉语音特征空间的粗耦合映射关系.为加强语音和视觉语音的关联性,系统分别根据语音特征与视觉语音特征的相似性两次对样本数据进行自动聚类,构造同时反映语音之间与视觉语音之间相似性的双层映射码本.数据预处理阶段,提出一种能反映视觉语音几何形状特征与牙齿可见度的联合特征模型,并在语音特征LPCC及MFCC基础上采用遗传算法提取视觉语音相关的语音特征模型.合成的视频中图像数据与原始视频中图像数据的比较结果表明,合成结果能在一定程度上逼近原始数据,取得了很好的效果.
提齣瞭一種基于雙層碼本的語音驅動視覺語音閤成繫統,該繫統以矢量量化的思想為基礎,建立語音特徵空間到視覺語音特徵空間的粗耦閤映射關繫.為加彊語音和視覺語音的關聯性,繫統分彆根據語音特徵與視覺語音特徵的相似性兩次對樣本數據進行自動聚類,構造同時反映語音之間與視覺語音之間相似性的雙層映射碼本.數據預處理階段,提齣一種能反映視覺語音幾何形狀特徵與牙齒可見度的聯閤特徵模型,併在語音特徵LPCC及MFCC基礎上採用遺傳算法提取視覺語音相關的語音特徵模型.閤成的視頻中圖像數據與原始視頻中圖像數據的比較結果錶明,閤成結果能在一定程度上逼近原始數據,取得瞭很好的效果.
제출료일충기우쌍층마본적어음구동시각어음합성계통,해계통이시량양화적사상위기출,건립어음특정공간도시각어음특정공간적조우합영사관계.위가강어음화시각어음적관련성,계통분별근거어음특정여시각어음특정적상사성량차대양본수거진행자동취류,구조동시반영어음지간여시각어음지간상사성적쌍층영사마본.수거예처리계단,제출일충능반영시각어음궤하형상특정여아치가견도적연합특정모형,병재어음특정LPCC급MFCC기출상채용유전산법제취시각어음상관적어음특정모형.합성적시빈중도상수거여원시시빈중도상수거적비교결과표명,합성결과능재일정정도상핍근원시수거,취득료흔호적효과.