计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2009年
28期
230-232
,共3页
中文地名识别%地名用字分析%最大熵
中文地名識彆%地名用字分析%最大熵
중문지명식별%지명용자분석%최대적
对中文地名未登录词识别而言,首先充分挖掘地名用字本身的特征,及其上下文用字的特征,其次通过最大熵模型把这些来源不同的知识整合.在特征选择和知识获取时,通过对中文地名这个特定群体进行针对性分析,得到了更多的信息,如中文地名更常用哪些字以及这些字如何搭配更常见等.最终使得系统在真实语料的封闭测试和开放测试中分别达到了F值87%和83%的较好效果.
對中文地名未登錄詞識彆而言,首先充分挖掘地名用字本身的特徵,及其上下文用字的特徵,其次通過最大熵模型把這些來源不同的知識整閤.在特徵選擇和知識穫取時,通過對中文地名這箇特定群體進行針對性分析,得到瞭更多的信息,如中文地名更常用哪些字以及這些字如何搭配更常見等.最終使得繫統在真實語料的封閉測試和開放測試中分彆達到瞭F值87%和83%的較好效果.
대중문지명미등록사식별이언,수선충분알굴지명용자본신적특정,급기상하문용자적특정,기차통과최대적모형파저사래원불동적지식정합.재특정선택화지식획취시,통과대중문지명저개특정군체진행침대성분석,득도료경다적신식,여중문지명경상용나사자이급저사자여하탑배경상견등.최종사득계통재진실어료적봉폐측시화개방측시중분별체도료F치87%화83%적교호효과.