计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2002年
6期
59-61,103
,共4页
语音识别%声学——语音层%特征提取
語音識彆%聲學——語音層%特徵提取
어음식별%성학——어음층%특정제취
文章提出一种提高汉语辅音识别性能的框架,在此框架下构造了一个基于声学-语音层分析的多级分类器,实现对全部汉语辅音的无重叠分类,测试了将辅音分类结果与概率统计模型结合的效果.重点讨论了用于汉语辅音分类的几种特征参数提取技术和实验结果.文章所提取的特征参数包括非嗓音段持续时间(DUP)、归一化的有效频带能量趋势等,涉及时域、频域和小波变换域等不同分析处理方法,特征参数简单、有效,具有较好的与后接元音无关和非特定人性质.分类器将21个汉语辅音分为5类,{m,n,l,r},{b,d,g},{p,t,k,f,h},{zh,ch,sh},{z,c,s,j,q,x};其分类正确率分别达97.21%、97.10%,97.70%,93.31%和94.80%.实验所用的语音资料库包括21个话者的孤立字汉语辅音发音资料.
文章提齣一種提高漢語輔音識彆性能的框架,在此框架下構造瞭一箇基于聲學-語音層分析的多級分類器,實現對全部漢語輔音的無重疊分類,測試瞭將輔音分類結果與概率統計模型結閤的效果.重點討論瞭用于漢語輔音分類的幾種特徵參數提取技術和實驗結果.文章所提取的特徵參數包括非嗓音段持續時間(DUP)、歸一化的有效頻帶能量趨勢等,涉及時域、頻域和小波變換域等不同分析處理方法,特徵參數簡單、有效,具有較好的與後接元音無關和非特定人性質.分類器將21箇漢語輔音分為5類,{m,n,l,r},{b,d,g},{p,t,k,f,h},{zh,ch,sh},{z,c,s,j,q,x};其分類正確率分彆達97.21%、97.10%,97.70%,93.31%和94.80%.實驗所用的語音資料庫包括21箇話者的孤立字漢語輔音髮音資料.
문장제출일충제고한어보음식별성능적광가,재차광가하구조료일개기우성학-어음층분석적다급분류기,실현대전부한어보음적무중첩분류,측시료장보음분류결과여개솔통계모형결합적효과.중점토론료용우한어보음분류적궤충특정삼수제취기술화실험결과.문장소제취적특정삼수포괄비상음단지속시간(DUP)、귀일화적유효빈대능량추세등,섭급시역、빈역화소파변환역등불동분석처리방법,특정삼수간단、유효,구유교호적여후접원음무관화비특정인성질.분류기장21개한어보음분위5류,{m,n,l,r},{b,d,g},{p,t,k,f,h},{zh,ch,sh},{z,c,s,j,q,x};기분류정학솔분별체97.21%、97.10%,97.70%,93.31%화94.80%.실험소용적어음자료고포괄21개화자적고립자한어보음발음자료.