科技创新与应用
科技創新與應用
과기창신여응용
Technology Innovation and Application
2013年
36期
300-300
,共1页
语音识别%语音截止频率%最大似然线性回归%模型自适应
語音識彆%語音截止頻率%最大似然線性迴歸%模型自適應
어음식별%어음절지빈솔%최대사연선성회귀%모형자괄응
语音识别系统往往会受到说话人的改变、信道失真、环境噪声等各种因素的干扰,从而导致预先训练的声学模型与实际环境语音的特征参数之间存在较大的差异,这会严重影响语音识别系统在实际环境下的识别性能。由于噪声主要影响语音的高频非周期部分,传统的最大似然线性回归算法在噪声自适应中难以取得令人满意的效果。文章提出了一种基于语音截止频率的最大似然线性回归算法,以当前测试环境的语音截止频率为频率上限,提取测试语音的特征参数;然后,将声学模型每个高斯单元的均值和方差从倒谱域变换到对数谱域,根据语音截止频率,忽略其高频分量,再变换回倒谱域;最后,根据测试环境下的少量自适应数据,利用最大似然线性回归算法对声学模型的参数进行调整,使其与当前环境相匹配。
語音識彆繫統往往會受到說話人的改變、信道失真、環境譟聲等各種因素的榦擾,從而導緻預先訓練的聲學模型與實際環境語音的特徵參數之間存在較大的差異,這會嚴重影響語音識彆繫統在實際環境下的識彆性能。由于譟聲主要影響語音的高頻非週期部分,傳統的最大似然線性迴歸算法在譟聲自適應中難以取得令人滿意的效果。文章提齣瞭一種基于語音截止頻率的最大似然線性迴歸算法,以噹前測試環境的語音截止頻率為頻率上限,提取測試語音的特徵參數;然後,將聲學模型每箇高斯單元的均值和方差從倒譜域變換到對數譜域,根據語音截止頻率,忽略其高頻分量,再變換迴倒譜域;最後,根據測試環境下的少量自適應數據,利用最大似然線性迴歸算法對聲學模型的參數進行調整,使其與噹前環境相匹配。
어음식별계통왕왕회수도설화인적개변、신도실진、배경조성등각충인소적간우,종이도치예선훈련적성학모형여실제배경어음적특정삼수지간존재교대적차이,저회엄중영향어음식별계통재실제배경하적식별성능。유우조성주요영향어음적고빈비주기부분,전통적최대사연선성회귀산법재조성자괄응중난이취득령인만의적효과。문장제출료일충기우어음절지빈솔적최대사연선성회귀산법,이당전측시배경적어음절지빈솔위빈솔상한,제취측시어음적특정삼수;연후,장성학모형매개고사단원적균치화방차종도보역변환도대수보역,근거어음절지빈솔,홀략기고빈분량,재변환회도보역;최후,근거측시배경하적소량자괄응수거,이용최대사연선성회귀산법대성학모형적삼수진행조정,사기여당전배경상필배。