信号处理
信號處理
신호처리
SIGNAL PROCESSING
2011年
12期
1914-1919
,共6页
周宇欢%张雄伟%付强%徐鑫%王金明
週宇歡%張雄偉%付彊%徐鑫%王金明
주우환%장웅위%부강%서흠%왕금명
说话人识别%多分形谱簇%标度区%高斯混合模型
說話人識彆%多分形譜簇%標度區%高斯混閤模型
설화인식별%다분형보족%표도구%고사혼합모형
语音是一种复杂的非线性信号,这使得基于线性系统理论发展起来的传统说话人识别技术性能难以进一步提高.本文提出了多分形谱簇分析方法,用于分析语音信号的非线性特征,并应用于短语音(2秒)说话人识别.通过对Cantor集的仿真实验,发现不同标度区能反映出系统不同阶段的生长规律,因此可用一组连续变化的多分形谱分层次地表征系统的分形特性,即多分形谱簇分析方法.然后结合语信号的分形特点,提出一种语音的多分形谱簇特征(Multifractal Spectrum Cluster Feature,MSCF)的提取方法.最后将几种非线性特征与短时谱特征结合用于说话人识别,基于TIMIT数据库50人的实验表明,非线性特征与短时谱特征互补性较强,特别是MSCF与MFCC、LPC特征结合,使得系统的误识率下降到0.8%.
語音是一種複雜的非線性信號,這使得基于線性繫統理論髮展起來的傳統說話人識彆技術性能難以進一步提高.本文提齣瞭多分形譜簇分析方法,用于分析語音信號的非線性特徵,併應用于短語音(2秒)說話人識彆.通過對Cantor集的倣真實驗,髮現不同標度區能反映齣繫統不同階段的生長規律,因此可用一組連續變化的多分形譜分層次地錶徵繫統的分形特性,即多分形譜簇分析方法.然後結閤語信號的分形特點,提齣一種語音的多分形譜簇特徵(Multifractal Spectrum Cluster Feature,MSCF)的提取方法.最後將幾種非線性特徵與短時譜特徵結閤用于說話人識彆,基于TIMIT數據庫50人的實驗錶明,非線性特徵與短時譜特徵互補性較彊,特彆是MSCF與MFCC、LPC特徵結閤,使得繫統的誤識率下降到0.8%.
어음시일충복잡적비선성신호,저사득기우선성계통이론발전기래적전통설화인식별기술성능난이진일보제고.본문제출료다분형보족분석방법,용우분석어음신호적비선성특정,병응용우단어음(2초)설화인식별.통과대Cantor집적방진실험,발현불동표도구능반영출계통불동계단적생장규률,인차가용일조련속변화적다분형보분층차지표정계통적분형특성,즉다분형보족분석방법.연후결합어신호적분형특점,제출일충어음적다분형보족특정(Multifractal Spectrum Cluster Feature,MSCF)적제취방법.최후장궤충비선성특정여단시보특정결합용우설화인식별,기우TIMIT수거고50인적실험표명,비선성특정여단시보특정호보성교강,특별시MSCF여MFCC、LPC특정결합,사득계통적오식솔하강도0.8%.