通信学报
通信學報
통신학보
JOURNAL OF CHINA INSTITUTE OF COMMUNICATIONS
2006年
2期
113-118
,共6页
信息检索%关键词检索%拼音图%置信度
信息檢索%關鍵詞檢索%拼音圖%置信度
신식검색%관건사검색%병음도%치신도
针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的.该系统分为预处理阶段和检索阶段.预处理阶段将语音数据识别成具有高覆盖率的拼音图,在这一过程中通过若干次的无监督最大似然线性回归自适应算法渐次提高拼音图的质量.检索阶段响应用户的频繁查询,只需在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选.实验表明:系统具有较高的召回率和正确率,且检索阶段仅需0.01倍实时,可以满足快速检索的需要.
針對音頻檢索任務中的關鍵詞檢索提齣一種新的基于拼音圖的兩階段檢索繫統,可以高效地從大量語音數據中檢索齣感興趣的文本信息,從而達到為國傢安全服務的目的.該繫統分為預處理階段和檢索階段.預處理階段將語音數據識彆成具有高覆蓋率的拼音圖,在這一過程中通過若榦次的無鑑督最大似然線性迴歸自適應算法漸次提高拼音圖的質量.檢索階段響應用戶的頻繁查詢,隻需在拼音圖中查找齣與關鍵詞拼音匹配的拼音串,併採用基于N元拼音文法的前後嚮算法計算置信度以實現對檢索結果的篩選.實驗錶明:繫統具有較高的召迴率和正確率,且檢索階段僅需0.01倍實時,可以滿足快速檢索的需要.
침대음빈검색임무중적관건사검색제출일충신적기우병음도적량계단검색계통,가이고효지종대량어음수거중검색출감흥취적문본신식,종이체도위국가안전복무적목적.해계통분위예처리계단화검색계단.예처리계단장어음수거식별성구유고복개솔적병음도,재저일과정중통과약간차적무감독최대사연선성회귀자괄응산법점차제고병음도적질량.검색계단향응용호적빈번사순,지수재병음도중사조출여관건사병음필배적병음천,병채용기우N원병음문법적전후향산법계산치신도이실현대검색결과적사선.실험표명:계통구유교고적소회솔화정학솔,차검색계단부수0.01배실시,가이만족쾌속검색적수요.