模式识别与人工智能
模式識彆與人工智能
모식식별여인공지능
Moshi Shibie yu Rengong Zhineng
2011年
4期
561-566
,共6页
中文语音检索%分词%查询扩展%有穷自动机%基于令牌的搜索
中文語音檢索%分詞%查詢擴展%有窮自動機%基于令牌的搜索
중문어음검색%분사%사순확전%유궁자동궤%기우령패적수색
中文语音检索系统用于快速准确地在中文语音文档中定位用户查询.典型实现方案对语音文档进行识别后建立索引,对查询串进行分词并以分词结果检索.检索过程中出现的查询分词与识别结果不匹配将影响系统性能.为解决该问题,产生多种查询分词结果,并对其进行前后缀扩展后检索.为解决因扩展带来的检索内容过多,用时较长的问题,引入有穷自动机压缩扩展,在此基础上设计基于令牌的搜索算法高效检索.实验证明,对查询的多分词与前后缀扩展可以使检索EER相对提升50%-70%,引入FSA可压缩检索空间,使得检索速度提升近30倍.
中文語音檢索繫統用于快速準確地在中文語音文檔中定位用戶查詢.典型實現方案對語音文檔進行識彆後建立索引,對查詢串進行分詞併以分詞結果檢索.檢索過程中齣現的查詢分詞與識彆結果不匹配將影響繫統性能.為解決該問題,產生多種查詢分詞結果,併對其進行前後綴擴展後檢索.為解決因擴展帶來的檢索內容過多,用時較長的問題,引入有窮自動機壓縮擴展,在此基礎上設計基于令牌的搜索算法高效檢索.實驗證明,對查詢的多分詞與前後綴擴展可以使檢索EER相對提升50%-70%,引入FSA可壓縮檢索空間,使得檢索速度提升近30倍.
중문어음검색계통용우쾌속준학지재중문어음문당중정위용호사순.전형실현방안대어음문당진행식별후건립색인,대사순천진행분사병이분사결과검색.검색과정중출현적사순분사여식별결과불필배장영향계통성능.위해결해문제,산생다충사순분사결과,병대기진행전후철확전후검색.위해결인확전대래적검색내용과다,용시교장적문제,인입유궁자동궤압축확전,재차기출상설계기우령패적수색산법고효검색.실험증명,대사순적다분사여전후철확전가이사검색EER상대제승50%-70%,인입FSA가압축검색공간,사득검색속도제승근30배.