电子与信息学报
電子與信息學報
전자여신식학보
JOURNAL OF ELECTRONICS & INFORMATION TECHNOLOGY
2004年
3期
375-381
,共7页
蒋冬梅%谢磊%Ilse Ravyse%赵荣椿%Hichem Sahli%Jan Cornelis
蔣鼕梅%謝磊%Ilse Ravyse%趙榮椿%Hichem Sahli%Jan Cornelis
장동매%사뢰%Ilse Ravyse%조영춘%Hichem Sahli%Jan Cornelis
说话人头部动画%Viseme%Triseme决策树%Viseme图像相似度加权%嘴形圆度%VSW曲线
說話人頭部動畫%Viseme%Triseme決策樹%Viseme圖像相似度加權%嘴形圓度%VSW麯線
설화인두부동화%Viseme%Triseme결책수%Viseme도상상사도가권%취형원도%VSW곡선
为实现听觉/视觉驱动的说话人头部动画,该文给出了一个基于viseme(说话时的基本嘴形单位)的连续语音识别系统.它训练viseme隐马尔可夫模型(HMM),识别语音为viseme图像序列.建模采用triseme的概念来考虑viseme的上下文相关性,但它需要超大量的训练数据.该文根据viseme图像及其相似度权值(VSW)定义视觉问题集,用来建立triseme决策树,以实现triseme的状态捆绑及HMM参数共享.为比较系统性能,基于phoneme(听觉领域的语音基本单位)的语音识别结果也被映射为viseme序列.在评价准则上,定义viseme图像相似度加权识别精度,更全面地考虑输出和参考图像序列的差别,并用嘴形圆度和VSW曲线中的突变点来评估所得viseme序列的平滑性.结果表明,基于viseme的语音识别系统能给出更平滑和合理的嘴形图像序列.
為實現聽覺/視覺驅動的說話人頭部動畫,該文給齣瞭一箇基于viseme(說話時的基本嘴形單位)的連續語音識彆繫統.它訓練viseme隱馬爾可伕模型(HMM),識彆語音為viseme圖像序列.建模採用triseme的概唸來攷慮viseme的上下文相關性,但它需要超大量的訓練數據.該文根據viseme圖像及其相似度權值(VSW)定義視覺問題集,用來建立triseme決策樹,以實現triseme的狀態捆綁及HMM參數共享.為比較繫統性能,基于phoneme(聽覺領域的語音基本單位)的語音識彆結果也被映射為viseme序列.在評價準則上,定義viseme圖像相似度加權識彆精度,更全麵地攷慮輸齣和參攷圖像序列的差彆,併用嘴形圓度和VSW麯線中的突變點來評估所得viseme序列的平滑性.結果錶明,基于viseme的語音識彆繫統能給齣更平滑和閤理的嘴形圖像序列.
위실현은각/시각구동적설화인두부동화,해문급출료일개기우viseme(설화시적기본취형단위)적련속어음식별계통.타훈련viseme은마이가부모형(HMM),식별어음위viseme도상서렬.건모채용triseme적개념래고필viseme적상하문상관성,단타수요초대량적훈련수거.해문근거viseme도상급기상사도권치(VSW)정의시각문제집,용래건립triseme결책수,이실현triseme적상태곤방급HMM삼수공향.위비교계통성능,기우phoneme(은각영역적어음기본단위)적어음식별결과야피영사위viseme서렬.재평개준칙상,정의viseme도상상사도가권식별정도,경전면지고필수출화삼고도상서렬적차별,병용취형원도화VSW곡선중적돌변점래평고소득viseme서렬적평활성.결과표명,기우viseme적어음식별계통능급출경평활화합리적취형도상서렬.