中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2009年
6期
72-78
,共7页
李素建%宋涛%高杰%幺鹏跃%李文捷
李素建%宋濤%高傑%幺鵬躍%李文捷
리소건%송도%고걸%요붕약%리문첩
人工智能%自然语言处理%领域性分析%领域词%领域部件词%链接分析%使用差异
人工智能%自然語言處理%領域性分析%領域詞%領域部件詞%鏈接分析%使用差異
인공지능%자연어언처리%영역성분석%영역사%영역부건사%련접분석%사용차이
artificial intelligence%natural language processing%domain analysis%domain term%domain term component%link analysis%usage discrepancy
领域知识的表达形式最终体现在词汇的领域性上,因此对领域词及其部件的领域度分析是一个关键.该文在分词的基础上,对各个领域语料进行分析,利用词语之间的关系,引入链接分析方法分析词语在各个领域中的使用重要性,并通过词语在各个领域中的使用差异性计算其领域度,从而达到领域分析的目的,获取某个领域的领域部件词.该文采用以上方法在军事、娱乐等领域进行了实验,实验结果表明该方法相对于当前常用的tf×idf方法和Bootstrapping方法,可以更有效地进行领域分析获取领域部件词.
領域知識的錶達形式最終體現在詞彙的領域性上,因此對領域詞及其部件的領域度分析是一箇關鍵.該文在分詞的基礎上,對各箇領域語料進行分析,利用詞語之間的關繫,引入鏈接分析方法分析詞語在各箇領域中的使用重要性,併通過詞語在各箇領域中的使用差異性計算其領域度,從而達到領域分析的目的,穫取某箇領域的領域部件詞.該文採用以上方法在軍事、娛樂等領域進行瞭實驗,實驗結果錶明該方法相對于噹前常用的tf×idf方法和Bootstrapping方法,可以更有效地進行領域分析穫取領域部件詞.
영역지식적표체형식최종체현재사회적영역성상,인차대영역사급기부건적영역도분석시일개관건.해문재분사적기출상,대각개영역어료진행분석,이용사어지간적관계,인입련접분석방법분석사어재각개영역중적사용중요성,병통과사어재각개영역중적사용차이성계산기영역도,종이체도영역분석적목적,획취모개영역적영역부건사.해문채용이상방법재군사、오악등영역진행료실험,실험결과표명해방법상대우당전상용적tf×idf방법화Bootstrapping방법,가이경유효지진행영역분석획취영역부건사.
The representation of domain knowledge usually focuses on the domain lexicons, and then domain analysis for terms or term components is a natural task. In this paper, we propose a novel domain analysis method based on the discrepancy of lexical usage. Based on the word segmentation result, we introduce a link analysis method to compute the usage degree of each word for several typical domain corpora. Then through analyzing the discrepancy of the word usage in different domains, we can acquire the domain term component with larger usage discrepancy. This method is experimented on several domains such as military, entertainment and so on, achieving better results than the commonly used tf × idf method and Bootstapping method.