计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2002年
14期
68-72
,共5页
谢旭东%丁晓青%彭良瑞%刘长松
謝旭東%丁曉青%彭良瑞%劉長鬆
사욱동%정효청%팽량서%류장송
日文识别%后处理%语言模型%统计方法%知识库
日文識彆%後處理%語言模型%統計方法%知識庫
일문식별%후처리%어언모형%통계방법%지식고
在文字识别系统中,为了进一步提高文本识别率,后处理模块是很重要的环节.文章针对日文的语言特性,建立统计方法和规则相结合的混和语言模型,实现了一个日文识别后处理系统.该系统首先利用Viterbi算法得到统计模型输出的最优结果,通过与前端识别器输入的识别结果相比较,确定可疑字位置,再利用上下文词匹配方法和语法规则库的使用对可疑字进行检错和纠错处理.经实验验证,该后处理系统对识别日文印刷体文本错误率平均下降21.4%.
在文字識彆繫統中,為瞭進一步提高文本識彆率,後處理模塊是很重要的環節.文章針對日文的語言特性,建立統計方法和規則相結閤的混和語言模型,實現瞭一箇日文識彆後處理繫統.該繫統首先利用Viterbi算法得到統計模型輸齣的最優結果,通過與前耑識彆器輸入的識彆結果相比較,確定可疑字位置,再利用上下文詞匹配方法和語法規則庫的使用對可疑字進行檢錯和糾錯處理.經實驗驗證,該後處理繫統對識彆日文印刷體文本錯誤率平均下降21.4%.
재문자식별계통중,위료진일보제고문본식별솔,후처리모괴시흔중요적배절.문장침대일문적어언특성,건립통계방법화규칙상결합적혼화어언모형,실현료일개일문식별후처리계통.해계통수선이용Viterbi산법득도통계모형수출적최우결과,통과여전단식별기수입적식별결과상비교,학정가의자위치,재이용상하문사필배방법화어법규칙고적사용대가의자진행검착화규착처리.경실험험증,해후처리계통대식별일문인쇄체문본착오솔평균하강21.4%.