中国科学技术大学学报
中國科學技術大學學報
중국과학기술대학학보
JOURNAL OF UNIVERSITY OF SCIENCE AND TECHNOLOGY OF CHINA
2007年
12期
1466-1471
,共6页
音频分类%Mel倒谱系数及其动态参数%区分性模型训练%特征筛选%多级二分类方法
音頻分類%Mel倒譜繫數及其動態參數%區分性模型訓練%特徵篩選%多級二分類方法
음빈분류%Mel도보계수급기동태삼수%구분성모형훈련%특정사선%다급이분류방법
采用同一种特征参数--Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频之间的差异,给出了一种区分性模型训练和特征筛选相结合的多级二分类音频分类方法,即为各级建立GMM(Gaussian mixture model)模型的同时挑选出使当前模型区分程度达到最大的特征子集.对长约2 h的音频数据集的测试结果表明,该方法相对于特征筛选前的分类系统,平均误识率下降了约23.5%,且各二分类子系统的特征维数也有明显地减少.
採用同一種特徵參數--Mel倒譜繫數及其動態參數區分純語音、帶揹景語音、樂器音、歌聲和環境音.根據該特徵參數的特點以及各類音頻之間的差異,給齣瞭一種區分性模型訓練和特徵篩選相結閤的多級二分類音頻分類方法,即為各級建立GMM(Gaussian mixture model)模型的同時挑選齣使噹前模型區分程度達到最大的特徵子集.對長約2 h的音頻數據集的測試結果錶明,該方法相對于特徵篩選前的分類繫統,平均誤識率下降瞭約23.5%,且各二分類子繫統的特徵維數也有明顯地減少.
채용동일충특정삼수--Mel도보계수급기동태삼수구분순어음、대배경어음、악기음、가성화배경음.근거해특정삼수적특점이급각류음빈지간적차이,급출료일충구분성모형훈련화특정사선상결합적다급이분류음빈분류방법,즉위각급건립GMM(Gaussian mixture model)모형적동시도선출사당전모형구분정도체도최대적특정자집.대장약2 h적음빈수거집적측시결과표명,해방법상대우특정사선전적분류계통,평균오식솔하강료약23.5%,차각이분류자계통적특정유수야유명현지감소.