当代语言学
噹代語言學
당대어언학
Contemporary Linguistics
2013年
2期
230~244
,共null页
李宏 章毅 徐飞玉 Hans Uszkoreit
李宏 章毅 徐飛玉 Hans Uszkoreit
리굉 장의 서비옥 Hans Uszkoreit
本体 信息抽取 关系抽取 规则自动学习
本體 信息抽取 關繫抽取 規則自動學習
본체 신식추취 관계추취 규칙자동학습
信息抽取是用来理解自然语言文本语义的一种非常实用的方法。而本体则对知识(例如实体和概念问的关系)的定义与建模起重要作用。因此本体经常被用来定义信息抽取任务。高级信息抽取技术,例如复杂的多元关系抽取,可用于学习语言模板,进而从自然文本中识别出本体定义的关系,并抽取出这些关系的实例。本文将描述一个为信息抽取任务而设计的本体模型,以及一个关系抽取的框架系统——DARE。DARE使用了机器学习方法,可以自动学习关系抽取的语言模板,并应用这些模板来抽取关系实例。DARE系统已被深度应用于英语文本的关系抽取。本文将进一步使用DARE来处理中文新闻文本,从中学习语言模板和抽取关系实例,并与英文处理的结果进行比较。
信息抽取是用來理解自然語言文本語義的一種非常實用的方法。而本體則對知識(例如實體和概唸問的關繫)的定義與建模起重要作用。因此本體經常被用來定義信息抽取任務。高級信息抽取技術,例如複雜的多元關繫抽取,可用于學習語言模闆,進而從自然文本中識彆齣本體定義的關繫,併抽取齣這些關繫的實例。本文將描述一箇為信息抽取任務而設計的本體模型,以及一箇關繫抽取的框架繫統——DARE。DARE使用瞭機器學習方法,可以自動學習關繫抽取的語言模闆,併應用這些模闆來抽取關繫實例。DARE繫統已被深度應用于英語文本的關繫抽取。本文將進一步使用DARE來處理中文新聞文本,從中學習語言模闆和抽取關繫實例,併與英文處理的結果進行比較。
신식추취시용래리해자연어언문본어의적일충비상실용적방법。이본체칙대지식(례여실체화개념문적관계)적정의여건모기중요작용。인차본체경상피용래정의신식추취임무。고급신식추취기술,례여복잡적다원관계추취,가용우학습어언모판,진이종자연문본중식별출본체정의적관계,병추취출저사관계적실례。본문장묘술일개위신식추취임무이설계적본체모형,이급일개관계추취적광가계통——DARE。DARE사용료궤기학습방법,가이자동학습관계추취적어언모판,병응용저사모판래추취관계실례。DARE계통이피심도응용우영어문본적관계추취。본문장진일보사용DARE래처리중문신문문본,종중학습어언모판화추취관계실례,병여영문처리적결과진행비교。