软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2013年
10期
2300-2311
,共12页
词义消歧%依存句法分析%知识获取%依存适配度
詞義消歧%依存句法分析%知識穫取%依存適配度
사의소기%의존구법분석%지식획취%의존괄배도
word sense disambiguation%dependency parsing%knowledge acquisition%dependency fitness
针对困扰词义消歧技术发展的知识匮乏问题,提出一种基于依存适配度的知识自动获取词义消歧方法.该方法充分利用依存句法分析技术的优势,首先对大规模语料进行依存句法分析,统计其中的依存元组信息构建依存知识库;然后对歧义词所在的句子进行依存句法分析,获得歧义词的依存约束集合;并根据WordNet获得歧义词各个词义的各类词义代表词;最后,根据依存知识库,综合考虑词义代表词在依存约束集合中的依存适配度,选择正确的词义.该方法在SemEval 2007的Task#7粗粒度词义消歧任务上取得了74.53%的消歧正确率;在不使用任何人工标注语料的无监督和基于知识库的同类方法中,取得了最佳的消歧效果.
針對睏擾詞義消歧技術髮展的知識匱乏問題,提齣一種基于依存適配度的知識自動穫取詞義消歧方法.該方法充分利用依存句法分析技術的優勢,首先對大規模語料進行依存句法分析,統計其中的依存元組信息構建依存知識庫;然後對歧義詞所在的句子進行依存句法分析,穫得歧義詞的依存約束集閤;併根據WordNet穫得歧義詞各箇詞義的各類詞義代錶詞;最後,根據依存知識庫,綜閤攷慮詞義代錶詞在依存約束集閤中的依存適配度,選擇正確的詞義.該方法在SemEval 2007的Task#7粗粒度詞義消歧任務上取得瞭74.53%的消歧正確率;在不使用任何人工標註語料的無鑑督和基于知識庫的同類方法中,取得瞭最佳的消歧效果.
침대곤우사의소기기술발전적지식궤핍문제,제출일충기우의존괄배도적지식자동획취사의소기방법.해방법충분이용의존구법분석기술적우세,수선대대규모어료진행의존구법분석,통계기중적의존원조신식구건의존지식고;연후대기의사소재적구자진행의존구법분석,획득기의사적의존약속집합;병근거WordNet획득기의사각개사의적각류사의대표사;최후,근거의존지식고,종합고필사의대표사재의존약속집합중적의존괄배도,선택정학적사의.해방법재SemEval 2007적Task#7조립도사의소기임무상취득료74.53%적소기정학솔;재불사용임하인공표주어료적무감독화기우지식고적동류방법중,취득료최가적소기효과.