数据采集与处理
數據採集與處理
수거채집여처리
JOURNAL OF DATA ACQUISITION & PROCESSING
2014年
2期
274-279
,共6页
语音检索%集外词%加权有限状态机
語音檢索%集外詞%加權有限狀態機
어음검색%집외사%가권유한상태궤
spoken term detection%out of vocabulary%weighted finite state transducer
针对关键词中的集外词检索任务,提出采用音素、音节、词片三种子词单元进行多流信息的联合检索算法,其中对基于音素的语音检索(Spoken term detection,STD)系统使用基于n元语言模型-加权有限状态机的完全匹配检索降低漏警,对基于音节、词片的STD系统使用模糊匹配检索降低虚警,最后采用线性逻辑回归(Linear logistic regression,LLR)的算法将三个子系统的结果进行融合.在NIST STD 2006语音检索评测的英语电话会话语音测试集上的实验结果表明,相对于最好的单流系统,多流信息融合获得了12%的实际词项权重值(Actual term weighted value,ATWV)相对提升.
針對關鍵詞中的集外詞檢索任務,提齣採用音素、音節、詞片三種子詞單元進行多流信息的聯閤檢索算法,其中對基于音素的語音檢索(Spoken term detection,STD)繫統使用基于n元語言模型-加權有限狀態機的完全匹配檢索降低漏警,對基于音節、詞片的STD繫統使用模糊匹配檢索降低虛警,最後採用線性邏輯迴歸(Linear logistic regression,LLR)的算法將三箇子繫統的結果進行融閤.在NIST STD 2006語音檢索評測的英語電話會話語音測試集上的實驗結果錶明,相對于最好的單流繫統,多流信息融閤穫得瞭12%的實際詞項權重值(Actual term weighted value,ATWV)相對提升.
침대관건사중적집외사검색임무,제출채용음소、음절、사편삼충자사단원진행다류신식적연합검색산법,기중대기우음소적어음검색(Spoken term detection,STD)계통사용기우n원어언모형-가권유한상태궤적완전필배검색강저루경,대기우음절、사편적STD계통사용모호필배검색강저허경,최후채용선성라집회귀(Linear logistic regression,LLR)적산법장삼개자계통적결과진행융합.재NIST STD 2006어음검색평측적영어전화회화어음측시집상적실험결과표명,상대우최호적단류계통,다류신식융합획득료12%적실제사항권중치(Actual term weighted value,ATWV)상대제승.