清华大学学报(自然科学版)
清華大學學報(自然科學版)
청화대학학보(자연과학판)
JOURNAL OF TSINGHUA UNIVERSITY SCIENCE AND TECHNOLOGY
2005年
10期
1356-1359
,共4页
信息检索%关键词检索%拼音图%置信度
信息檢索%關鍵詞檢索%拼音圖%置信度
신식검색%관건사검색%병음도%치신도
针对当前关键词检索系统中单阶段系统检索速度慢,基于大词汇量连续语音识别(LVCSR)的两阶段系统又不够稳健的现状,提出一种新的基于拼音图的两阶段检索系统以满足快速、稳健检索的需要.两阶段分为预处理阶段和检索阶段.预处理阶段将语音数据识别成具有高覆盖率的拼音图.检索阶段响应用户的频繁查询,在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选.实验表明:系统的二字词召回率及正确率可达72.19%和72.68%,三字词召回率及正确率可达73.51%和82.98%,均优于LVCSR系统,且检索阶段仅需0.01倍实时,具有良好的实用价值.
針對噹前關鍵詞檢索繫統中單階段繫統檢索速度慢,基于大詞彙量連續語音識彆(LVCSR)的兩階段繫統又不夠穩健的現狀,提齣一種新的基于拼音圖的兩階段檢索繫統以滿足快速、穩健檢索的需要.兩階段分為預處理階段和檢索階段.預處理階段將語音數據識彆成具有高覆蓋率的拼音圖.檢索階段響應用戶的頻繁查詢,在拼音圖中查找齣與關鍵詞拼音匹配的拼音串,併採用基于N元拼音文法的前後嚮算法計算置信度以實現對檢索結果的篩選.實驗錶明:繫統的二字詞召迴率及正確率可達72.19%和72.68%,三字詞召迴率及正確率可達73.51%和82.98%,均優于LVCSR繫統,且檢索階段僅需0.01倍實時,具有良好的實用價值.
침대당전관건사검색계통중단계단계통검색속도만,기우대사회량련속어음식별(LVCSR)적량계단계통우불구은건적현상,제출일충신적기우병음도적량계단검색계통이만족쾌속、은건검색적수요.량계단분위예처리계단화검색계단.예처리계단장어음수거식별성구유고복개솔적병음도.검색계단향응용호적빈번사순,재병음도중사조출여관건사병음필배적병음천,병채용기우N원병음문법적전후향산법계산치신도이실현대검색결과적사선.실험표명:계통적이자사소회솔급정학솔가체72.19%화72.68%,삼자사소회솔급정학솔가체73.51%화82.98%,균우우LVCSR계통,차검색계단부수0.01배실시,구유량호적실용개치.