计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2003年
1期
17-18,26
,共3页
郑德权%于凤%王开涛%赵铁军
鄭德權%于鳳%王開濤%趙鐵軍
정덕권%우봉%왕개도%조철군
互信息%t-信息差%二字应成词%自动分词%歧义字段
互信息%t-信息差%二字應成詞%自動分詞%歧義字段
호신식%t-신식차%이자응성사%자동분사%기의자단
文章提出了利用汉语中的二字应成词,计算汉语句内相邻字之间的互信息[1]及t-信息差这两个统计信息量的新方法,进而应用这两个统计量,解决汉语自动分词中的歧义字段的自动切分问题.实验结果表明,采用该文所述的方法,对歧义字段的切分正确率将达到90%,与其他分词方法相比较,进一步提高了系统的分词精度,尤其与文献[1]所述方法比较,对于有大量汉语信息的语料,将降低系统的时间复杂度.
文章提齣瞭利用漢語中的二字應成詞,計算漢語句內相鄰字之間的互信息[1]及t-信息差這兩箇統計信息量的新方法,進而應用這兩箇統計量,解決漢語自動分詞中的歧義字段的自動切分問題.實驗結果錶明,採用該文所述的方法,對歧義字段的切分正確率將達到90%,與其他分詞方法相比較,進一步提高瞭繫統的分詞精度,尤其與文獻[1]所述方法比較,對于有大量漢語信息的語料,將降低繫統的時間複雜度.
문장제출료이용한어중적이자응성사,계산한어구내상린자지간적호신식[1]급t-신식차저량개통계신식량적신방법,진이응용저량개통계량,해결한어자동분사중적기의자단적자동절분문제.실험결과표명,채용해문소술적방법,대기의자단적절분정학솔장체도90%,여기타분사방법상비교,진일보제고료계통적분사정도,우기여문헌[1]소술방법비교,대우유대량한어신식적어료,장강저계통적시간복잡도.