中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
1期
42-50
,共9页
信息抽取%信息去重%命名实体
信息抽取%信息去重%命名實體
신식추취%신식거중%명명실체
冗余信息去重是信息抽取中的重要任务,对于多元素表示的信息,该文针对以往对各个元素统一处理所存在的问题,将信息元素进行分类,由各类元素的冗余判断难易出发,归纳相似度计算方法,并将各相似度作为特征,通过分类器判断信息间的冗余性.同时对最难判断的命名实体信息元素,该文从其他易判断相似性的信息元素出发,通过同义命名实体的自动扩展,提高信息去重的效果.
冗餘信息去重是信息抽取中的重要任務,對于多元素錶示的信息,該文針對以往對各箇元素統一處理所存在的問題,將信息元素進行分類,由各類元素的冗餘判斷難易齣髮,歸納相似度計算方法,併將各相似度作為特徵,通過分類器判斷信息間的冗餘性.同時對最難判斷的命名實體信息元素,該文從其他易判斷相似性的信息元素齣髮,通過同義命名實體的自動擴展,提高信息去重的效果.
용여신식거중시신식추취중적중요임무,대우다원소표시적신식,해문침대이왕대각개원소통일처리소존재적문제,장신식원소진행분류,유각류원소적용여판단난역출발,귀납상사도계산방법,병장각상사도작위특정,통과분류기판단신식간적용여성.동시대최난판단적명명실체신식원소,해문종기타역판단상사성적신식원소출발,통과동의명명실체적자동확전,제고신식거중적효과.