小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2008年
2期
364-367
,共4页
朱鸿宇%刘瑰%陈左宁%唐福华
硃鴻宇%劉瑰%陳左寧%唐福華
주홍우%류괴%진좌저%당복화
实体关系识别%长距离依赖%全连通随机场%相似度计算
實體關繫識彆%長距離依賴%全連通隨機場%相似度計算
실체관계식별%장거리의뢰%전련통수궤장%상사도계산
实体关系识别是信息抽取中的关键步骤,传统的词袋模型受到长距离依赖问题的影响,在处理实体关系识别过程中的性能不佳.条件随机场具有灵活的特征表达能力,因此非常适合表示复杂的语言现象.但传统的Linear-Chain CRF仍然不能表示长距离依赖问题,而Skip-Chain CRF仅考虑了相同词的长距离依赖问题,并且由于计算过于复杂,因此很难进行扩展.本文提出了一种新型的全连通随机场模型,使用词的相似度来建立依赖关系和使用词的互信息来删除依赖关系,同时改进了词的相似度计算公式,使其能够表示距离依赖关系,从而在解决长距离语言约束问题上克服了以往统计学习模型的缺陷,并在计算强度上与Linear-Chain CRF大致相当,在实体关系识别中的性能超过了目前的Linear-Chain CRF和Skip-Chain CRF.
實體關繫識彆是信息抽取中的關鍵步驟,傳統的詞袋模型受到長距離依賴問題的影響,在處理實體關繫識彆過程中的性能不佳.條件隨機場具有靈活的特徵錶達能力,因此非常適閤錶示複雜的語言現象.但傳統的Linear-Chain CRF仍然不能錶示長距離依賴問題,而Skip-Chain CRF僅攷慮瞭相同詞的長距離依賴問題,併且由于計算過于複雜,因此很難進行擴展.本文提齣瞭一種新型的全連通隨機場模型,使用詞的相似度來建立依賴關繫和使用詞的互信息來刪除依賴關繫,同時改進瞭詞的相似度計算公式,使其能夠錶示距離依賴關繫,從而在解決長距離語言約束問題上剋服瞭以往統計學習模型的缺陷,併在計算彊度上與Linear-Chain CRF大緻相噹,在實體關繫識彆中的性能超過瞭目前的Linear-Chain CRF和Skip-Chain CRF.
실체관계식별시신식추취중적관건보취,전통적사대모형수도장거리의뢰문제적영향,재처리실체관계식별과정중적성능불가.조건수궤장구유령활적특정표체능력,인차비상괄합표시복잡적어언현상.단전통적Linear-Chain CRF잉연불능표시장거리의뢰문제,이Skip-Chain CRF부고필료상동사적장거리의뢰문제,병차유우계산과우복잡,인차흔난진행확전.본문제출료일충신형적전련통수궤장모형,사용사적상사도래건립의뢰관계화사용사적호신식래산제의뢰관계,동시개진료사적상사도계산공식,사기능구표시거리의뢰관계,종이재해결장거리어언약속문제상극복료이왕통계학습모형적결함,병재계산강도상여Linear-Chain CRF대치상당,재실체관계식별중적성능초과료목전적Linear-Chain CRF화Skip-Chain CRF.