清华大学学报(自然科学版)
清華大學學報(自然科學版)
청화대학학보(자연과학판)
Journal of Tsinghua University
2001年
4_5期
222-226
,共5页
苑春法%李莼%崔永华%邢红兵
苑春法%李莼%崔永華%邢紅兵
원춘법%리순%최영화%형홍병
遗传算法%构词%汉语语素
遺傳算法%構詞%漢語語素
유전산법%구사%한어어소
genetic algorithm%word formation%Chinese morpheme
从语素数据库中获取语素的构词知识,研究汉语的构词规律对于汉语信息处理具有非常重要的意义。汉语语素数据库是一个大规模的含有丰富汉语构词知识的数据库,而遗传算法是求解大规模复杂组合寻优问题的一种有效手段。在汉语构词规律的研究中,首次引入遗传算法对带有构词方式、类序、字义组合以及首、尾语义类(分大类层次和中类层次)5个特征的汉语二字复合名词的构词规律进行了探索,并取得了阶段性成果。实验证明,在大规模汉语语素数据库的基础上使用遗传算法研究汉语的构词规律是一种有效的方法。
從語素數據庫中穫取語素的構詞知識,研究漢語的構詞規律對于漢語信息處理具有非常重要的意義。漢語語素數據庫是一箇大規模的含有豐富漢語構詞知識的數據庫,而遺傳算法是求解大規模複雜組閤尋優問題的一種有效手段。在漢語構詞規律的研究中,首次引入遺傳算法對帶有構詞方式、類序、字義組閤以及首、尾語義類(分大類層次和中類層次)5箇特徵的漢語二字複閤名詞的構詞規律進行瞭探索,併取得瞭階段性成果。實驗證明,在大規模漢語語素數據庫的基礎上使用遺傳算法研究漢語的構詞規律是一種有效的方法。
종어소수거고중획취어소적구사지식,연구한어적구사규률대우한어신식처리구유비상중요적의의。한어어소수거고시일개대규모적함유봉부한어구사지식적수거고,이유전산법시구해대규모복잡조합심우문제적일충유효수단。재한어구사규률적연구중,수차인입유전산법대대유구사방식、류서、자의조합이급수、미어의류(분대류층차화중류층차)5개특정적한어이자복합명사적구사규률진행료탐색,병취득료계단성성과。실험증명,재대규모한어어소수거고적기출상사용유전산법연구한어적구사규률시일충유효적방법。
The Chinese morpheme database is a large knowledge database aboutword formation. Chinese Natural Language Processing (NLP) needs to acquire word formation knowledge for Chinese compound words from this database. This paper describes the use of the genetic algorithm for Chinese NLP to study multi feature Chinese word formation. The analysis studied the combinatorial regulation of two character compound words with five features, the formation pattern, the sequence of morpheme category, the mean related to morphemes and the sense category of two morphemes (in major or medium categories). The results show that the genetic algorithm is an effective method for studying Chinese word formation based on the Chinese morpheme database.