网络新媒体技术
網絡新媒體技術
망락신매체기술
JOURNAL OF NETWORK NEW MEDIA
2012年
2期
47-53
,共7页
蒋同海%齐耀辉%葛凤培%颜永红
蔣同海%齊耀輝%葛鳳培%顏永紅
장동해%제요휘%갈봉배%안영홍
文本无关发音质量评估%声学模型%MAP%基于说话人的倒谱均值方差规整
文本無關髮音質量評估%聲學模型%MAP%基于說話人的倒譜均值方差規整
문본무관발음질량평고%성학모형%MAP%기우설화인적도보균치방차규정
在无关的发音质量评估系统中,需要先识别出待测语音的说话内容,才能进行准确评估.真实的评测数据往往有很多不利的因素影响识别正确率,包括噪声、方言口音、信道噪声、说话随意性等.针对这些不利因素,本文对声学模型进行了深入的研究,包括:在训练数据中加入背景噪声,增强了模型的抗噪声能力;采用基于说话人的倒谱均值方差规整(SCMVN),降低信道及说话人个体特性的影响;用和待测语音相同地域的朗读数据做最大后验概率(MAP)自适应,使模型带有当地方言口音的发音特点;用自然口语数据做MAP自适应,使模型较好地描述自然口语中比较随意的发音现象.实验结果表明,使用这些措施之后,使待测语音的识别正确率相对提高了44.1%,从而使机器评分和专家评分的相关系数相对提高了6.3%.
在無關的髮音質量評估繫統中,需要先識彆齣待測語音的說話內容,纔能進行準確評估.真實的評測數據往往有很多不利的因素影響識彆正確率,包括譟聲、方言口音、信道譟聲、說話隨意性等.針對這些不利因素,本文對聲學模型進行瞭深入的研究,包括:在訓練數據中加入揹景譟聲,增彊瞭模型的抗譟聲能力;採用基于說話人的倒譜均值方差規整(SCMVN),降低信道及說話人箇體特性的影響;用和待測語音相同地域的朗讀數據做最大後驗概率(MAP)自適應,使模型帶有噹地方言口音的髮音特點;用自然口語數據做MAP自適應,使模型較好地描述自然口語中比較隨意的髮音現象.實驗結果錶明,使用這些措施之後,使待測語音的識彆正確率相對提高瞭44.1%,從而使機器評分和專傢評分的相關繫數相對提高瞭6.3%.
재무관적발음질량평고계통중,수요선식별출대측어음적설화내용,재능진행준학평고.진실적평측수거왕왕유흔다불리적인소영향식별정학솔,포괄조성、방언구음、신도조성、설화수의성등.침대저사불리인소,본문대성학모형진행료심입적연구,포괄:재훈련수거중가입배경조성,증강료모형적항조성능력;채용기우설화인적도보균치방차규정(SCMVN),강저신도급설화인개체특성적영향;용화대측어음상동지역적랑독수거주최대후험개솔(MAP)자괄응,사모형대유당지방언구음적발음특점;용자연구어수거주MAP자괄응,사모형교호지묘술자연구어중비교수의적발음현상.실험결과표명,사용저사조시지후,사대측어음적식별정학솔상대제고료44.1%,종이사궤기평분화전가평분적상관계수상대제고료6.3%.