中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2014年
5期
182-186,197
,共6页
张力文%努尔麦麦提·尤鲁瓦斯%吾守尔·斯拉木
張力文%努爾麥麥提·尤魯瓦斯%吾守爾·斯拉木
장력문%노이맥맥제·우로와사%오수이·사랍목
维吾尔语%语音检索%语音识别%词图%混淆网络%倒排索引
維吾爾語%語音檢索%語音識彆%詞圖%混淆網絡%倒排索引
유오이어%어음검색%어음식별%사도%혼효망락%도배색인
Uyghur%speech retrieval%speech recognition%lattice%Confusion Network (CN)%inversed index
随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义.目前研究人员对针对英语和汉语的语音检索技术进行了深入的研究,而针对维吾尔语的语音检索技术还处于起步阶段.该文对维吾尔语语音关键词检索技术进行了研究并采用了大词汇量连续语音识别、利用聚类算法将多候选词图转换为混淆网络、倒排索引、置信度以及相关度的计算等技术和方法,对维吾尔语语音检索系统进行了研究与搭建.最后在测试集上对该系统进行测试,测试结果显示,在语音识别正确率为82.1%的情况下,检索系统的召回率分别达到97.0%和79.1%时,虚警率分别为13.5%和8.5%.
隨著大數據時代的到來,各種音頻、視頻文件日益增多,如何高效地定位關鍵敏感信息具有非常重要的研究意義.目前研究人員對針對英語和漢語的語音檢索技術進行瞭深入的研究,而針對維吾爾語的語音檢索技術還處于起步階段.該文對維吾爾語語音關鍵詞檢索技術進行瞭研究併採用瞭大詞彙量連續語音識彆、利用聚類算法將多候選詞圖轉換為混淆網絡、倒排索引、置信度以及相關度的計算等技術和方法,對維吾爾語語音檢索繫統進行瞭研究與搭建.最後在測試集上對該繫統進行測試,測試結果顯示,在語音識彆正確率為82.1%的情況下,檢索繫統的召迴率分彆達到97.0%和79.1%時,虛警率分彆為13.5%和8.5%.
수착대수거시대적도래,각충음빈、시빈문건일익증다,여하고효지정위관건민감신식구유비상중요적연구의의.목전연구인원대침대영어화한어적어음검색기술진행료심입적연구,이침대유오이어적어음검색기술환처우기보계단.해문대유오이어어음관건사검색기술진행료연구병채용료대사회량련속어음식별、이용취류산법장다후선사도전환위혼효망락、도배색인、치신도이급상관도적계산등기술화방법,대유오이어어음검색계통진행료연구여탑건.최후재측시집상대해계통진행측시,측시결과현시,재어음식별정학솔위82.1%적정황하,검색계통적소회솔분별체도97.0%화79.1%시,허경솔분별위13.5%화8.5%.