计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2011年
7期
170-174
,共5页
信息抽取%简历信息%关系元组
信息抽取%簡歷信息%關繫元組
신식추취%간력신식%관계원조
实体关系抽取是目前信息抽取研究的热点.提出的简历信息抽取,就是从网页数据中抽取得到关于人的出身、学习教育、工作经历的三类不同关系元组(由两个实体和关系表示组成),从而整理出现实生活中人的简历信息.在基于句子分块(Chunk)和命名实体识别(NER)标记的抽取模式基础上,利用Wikipedia作为知识库,提出基于当前元组与关系表示集合语义相似度的关系判别算法对按照模式抽取得到的关系元组进行过滤和分类.实验结果表明抽取精度和F值对比基准方法上有了较大提高,并且实现了较高精度的简历信息类型分类.
實體關繫抽取是目前信息抽取研究的熱點.提齣的簡歷信息抽取,就是從網頁數據中抽取得到關于人的齣身、學習教育、工作經歷的三類不同關繫元組(由兩箇實體和關繫錶示組成),從而整理齣現實生活中人的簡歷信息.在基于句子分塊(Chunk)和命名實體識彆(NER)標記的抽取模式基礎上,利用Wikipedia作為知識庫,提齣基于噹前元組與關繫錶示集閤語義相似度的關繫判彆算法對按照模式抽取得到的關繫元組進行過濾和分類.實驗結果錶明抽取精度和F值對比基準方法上有瞭較大提高,併且實現瞭較高精度的簡歷信息類型分類.
실체관계추취시목전신식추취연구적열점.제출적간력신식추취,취시종망혈수거중추취득도관우인적출신、학습교육、공작경력적삼류불동관계원조(유량개실체화관계표시조성),종이정리출현실생활중인적간력신식.재기우구자분괴(Chunk)화명명실체식별(NER)표기적추취모식기출상,이용Wikipedia작위지식고,제출기우당전원조여관계표시집합어의상사도적관계판별산법대안조모식추취득도적관계원조진행과려화분류.실험결과표명추취정도화F치대비기준방법상유료교대제고,병차실현료교고정도적간력신식류형분류.