清华大学学报(自然科学版)
清華大學學報(自然科學版)
청화대학학보(자연과학판)
JOURNAL OF TSINGHUA UNIVERSITY SCIENCE AND TECHNOLOGY
2000年
9期
57-60
,共4页
计算语言学%中文信息处理%汉语词类自动标注%隐Markov模型
計算語言學%中文信息處理%漢語詞類自動標註%隱Markov模型
계산어언학%중문신식처리%한어사류자동표주%은Markov모형
汉语词类自动标注技术在中文信息处理现实应用中占据着十分重要的位置.论文在经过人工分词和词类标注的大规模汉语语料库的支持下,通过一系列对比实验,对基于隐Markov模型的汉语词类自动标注算法进行了系统的考察,并得出结论: ① Bigram模型的"性能价格比"较Trigram模型更令人满意;②以7万词次左右的标注语料库训练Bigram模型即已基本够用(此时,兼类词词类标注正确率及文本词类标注正确率分别可达93%和97%以上);③ Bigram模型对不同领域具有一定的适应性.这些结论对设计实用型汉语词类自动标注系统具有指导意义.
漢語詞類自動標註技術在中文信息處理現實應用中佔據著十分重要的位置.論文在經過人工分詞和詞類標註的大規模漢語語料庫的支持下,通過一繫列對比實驗,對基于隱Markov模型的漢語詞類自動標註算法進行瞭繫統的攷察,併得齣結論: ① Bigram模型的"性能價格比"較Trigram模型更令人滿意;②以7萬詞次左右的標註語料庫訓練Bigram模型即已基本夠用(此時,兼類詞詞類標註正確率及文本詞類標註正確率分彆可達93%和97%以上);③ Bigram模型對不同領域具有一定的適應性.這些結論對設計實用型漢語詞類自動標註繫統具有指導意義.
한어사류자동표주기술재중문신식처리현실응용중점거착십분중요적위치.논문재경과인공분사화사류표주적대규모한어어료고적지지하,통과일계렬대비실험,대기우은Markov모형적한어사류자동표주산법진행료계통적고찰,병득출결론: ① Bigram모형적"성능개격비"교Trigram모형경령인만의;②이7만사차좌우적표주어료고훈련Bigram모형즉이기본구용(차시,겸류사사류표주정학솔급문본사류표주정학솔분별가체93%화97%이상);③ Bigram모형대불동영역구유일정적괄응성.저사결론대설계실용형한어사류자동표주계통구유지도의의.