计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2005年
7期
1185-1190
,共6页
视觉语音%人脸动画参数(FAP)%混合高斯模型(GMM)%变形模板
視覺語音%人臉動畫參數(FAP)%混閤高斯模型(GMM)%變形模闆
시각어음%인검동화삼수(FAP)%혼합고사모형(GMM)%변형모판
视觉语音参数估计在视觉语音的研究中占有重要的地位.从MPEG-4定义的人脸动画参数FAP中选择24个与发音有直接关系的参数来描述视觉语音,将统计学习方法和基于规则的方法结合起来,利用人脸颜色概率分布信息和先验形状及边缘知识跟踪嘴唇轮廓线和人脸特征点,取得了较为精确的跟踪效果.在滤除参考点跟踪中的高频噪声后,利用人脸上最为突出的4个参考点估计出主要的人脸运动姿态,从而消除了全局运动的影响,最后根据这些人脸特征点的运动计算出准确的视觉语音参数,并得到了实际应用.
視覺語音參數估計在視覺語音的研究中佔有重要的地位.從MPEG-4定義的人臉動畫參數FAP中選擇24箇與髮音有直接關繫的參數來描述視覺語音,將統計學習方法和基于規則的方法結閤起來,利用人臉顏色概率分佈信息和先驗形狀及邊緣知識跟蹤嘴脣輪廓線和人臉特徵點,取得瞭較為精確的跟蹤效果.在濾除參攷點跟蹤中的高頻譟聲後,利用人臉上最為突齣的4箇參攷點估計齣主要的人臉運動姿態,從而消除瞭全跼運動的影響,最後根據這些人臉特徵點的運動計算齣準確的視覺語音參數,併得到瞭實際應用.
시각어음삼수고계재시각어음적연구중점유중요적지위.종MPEG-4정의적인검동화삼수FAP중선택24개여발음유직접관계적삼수래묘술시각어음,장통계학습방법화기우규칙적방법결합기래,이용인검안색개솔분포신식화선험형상급변연지식근종취진륜곽선화인검특정점,취득료교위정학적근종효과.재려제삼고점근종중적고빈조성후,이용인검상최위돌출적4개삼고점고계출주요적인검운동자태,종이소제료전국운동적영향,최후근거저사인검특정점적운동계산출준학적시각어음삼수,병득도료실제응용.