中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
2期
1-9
,共9页
实体集合扩展%知识库%语义知识
實體集閤擴展%知識庫%語義知識
실체집합확전%지식고%어의지식
实体集合扩展是开放式信息抽取的一个重要问题,该问题研究如何从一个语义类的若干实体(称为种子)出发,得到该类别的更多实体.现有实体集合扩展方法主要使用上下文模板或种子在语料中的分布信息进行抽取,其缺点是无法解决种子的歧义问题,而该问题会影响方法的有效性.在该文中,作者提出了一种融合实体语义知识的实体集合扩展方法,通过引入语义知识来解决种子歧义性问题.新方法通过使用Wikipedia实现了语义知识的引入,并把基于语义知识的扩展方法和基于模板的扩展方法相融合.实验表明,与单纯基于上下文方法相比,该文方法在准确率上提升了18.5%,召回率上提升了6.8%,MAP值上提升了22.8%.
實體集閤擴展是開放式信息抽取的一箇重要問題,該問題研究如何從一箇語義類的若榦實體(稱為種子)齣髮,得到該類彆的更多實體.現有實體集閤擴展方法主要使用上下文模闆或種子在語料中的分佈信息進行抽取,其缺點是無法解決種子的歧義問題,而該問題會影響方法的有效性.在該文中,作者提齣瞭一種融閤實體語義知識的實體集閤擴展方法,通過引入語義知識來解決種子歧義性問題.新方法通過使用Wikipedia實現瞭語義知識的引入,併把基于語義知識的擴展方法和基于模闆的擴展方法相融閤.實驗錶明,與單純基于上下文方法相比,該文方法在準確率上提升瞭18.5%,召迴率上提升瞭6.8%,MAP值上提升瞭22.8%.
실체집합확전시개방식신식추취적일개중요문제,해문제연구여하종일개어의류적약간실체(칭위충자)출발,득도해유별적경다실체.현유실체집합확전방법주요사용상하문모판혹충자재어료중적분포신식진행추취,기결점시무법해결충자적기의문제,이해문제회영향방법적유효성.재해문중,작자제출료일충융합실체어의지식적실체집합확전방법,통과인입어의지식래해결충자기의성문제.신방법통과사용Wikipedia실현료어의지식적인입,병파기우어의지식적확전방법화기우모판적확전방법상융합.실험표명,여단순기우상하문방법상비,해문방법재준학솔상제승료18.5%,소회솔상제승료6.8%,MAP치상제승료22.8%.