南京大学学报(自然科学版)
南京大學學報(自然科學版)
남경대학학보(자연과학판)
JOURNAL OF NANJING UNIVERSITY
2003年
4期
525-531
,共7页
混响声场%语音识别%滤波规整的Mel频率倒谱参数%矢量量化
混響聲場%語音識彆%濾波規整的Mel頻率倒譜參數%矢量量化
혼향성장%어음식별%려파규정적Mel빈솔도보삼수%시량양화
免提式话筒语音识别系统是语音识别走向实用的目标之一.实现这一系统,首先要解决房间效应引起的混响问题.通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数--滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化.识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%.提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率.该方法不仅识别率高,而且运算量小、所需内存空间小,易于做成小型实用的快速识别系统.
免提式話筒語音識彆繫統是語音識彆走嚮實用的目標之一.實現這一繫統,首先要解決房間效應引起的混響問題.通過討論室內混響聲場中語音的特點,提齣用魯棒性特徵參數--濾波規整的Mel頻率倒譜參數(FNMFCC),即MFCC參數在對數功率譜域進行低通濾波,倒譜域進行均值減,併用標準差加權進行非線性規整,採用這3種措施來消除混響引起的語音參數的變化.識彆方法用矢量量化法,用4組無混響數碼語音進行訓練,對特定人無混響和4種混響聲場中共150組數碼音的平均識彆率達到98.7%.提齣的這一新方法在不降低無混響音識彆率的情況下,提高瞭混響聲場的語音識彆率.該方法不僅識彆率高,而且運算量小、所需內存空間小,易于做成小型實用的快速識彆繫統.
면제식화통어음식별계통시어음식별주향실용적목표지일.실현저일계통,수선요해결방간효응인기적혼향문제.통과토론실내혼향성장중어음적특점,제출용로봉성특정삼수--려파규정적Mel빈솔도보삼수(FNMFCC),즉MFCC삼수재대수공솔보역진행저통려파,도보역진행균치감,병용표준차가권진행비선성규정,채용저3충조시래소제혼향인기적어음삼수적변화.식별방법용시량양화법,용4조무혼향수마어음진행훈련,대특정인무혼향화4충혼향성장중공150조수마음적평균식별솔체도98.7%.제출적저일신방법재불강저무혼향음식별솔적정황하,제고료혼향성장적어음식별솔.해방법불부식별솔고,이차운산량소、소수내존공간소,역우주성소형실용적쾌속식별계통.