计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2011年
8期
232-235
,共4页
许旭阳%李弼程%张先飞%韩永峰
許旭暘%李弼程%張先飛%韓永峰
허욱양%리필정%장선비%한영봉
事件实例%分类%新闻文本%聚类%事件抽取
事件實例%分類%新聞文本%聚類%事件抽取
사건실례%분류%신문문본%취류%사건추취
目前,事件抽取的流行方法是以事件元素或触发词进行驱动,但该方法容易导致正反例不平衡,且在语料库规模较小时存在一定的数据稀疏问题.提出了一种基于事件实例驱动的事件抽取方法.首先,从文档句子中抽取出刻画一个事件发生有代表性的特征,构成候选事件实例表示;其次,通过二元分类器对新闻文本中的事件实例与非事件实例进行分类;最后,对事件实例采用基于层次聚类的k-medoids算法完成事件抽取.该方法不仅克服了正反例失衡以及数据稀疏问题,而且解决了预先定义事件类别的局限性.实验结果验证了该方法的有效性,对比传统方法,事件抽取的准确率与召回率均获得了显著的提高.
目前,事件抽取的流行方法是以事件元素或觸髮詞進行驅動,但該方法容易導緻正反例不平衡,且在語料庫規模較小時存在一定的數據稀疏問題.提齣瞭一種基于事件實例驅動的事件抽取方法.首先,從文檔句子中抽取齣刻畫一箇事件髮生有代錶性的特徵,構成候選事件實例錶示;其次,通過二元分類器對新聞文本中的事件實例與非事件實例進行分類;最後,對事件實例採用基于層次聚類的k-medoids算法完成事件抽取.該方法不僅剋服瞭正反例失衡以及數據稀疏問題,而且解決瞭預先定義事件類彆的跼限性.實驗結果驗證瞭該方法的有效性,對比傳統方法,事件抽取的準確率與召迴率均穫得瞭顯著的提高.
목전,사건추취적류행방법시이사건원소혹촉발사진행구동,단해방법용역도치정반례불평형,차재어료고규모교소시존재일정적수거희소문제.제출료일충기우사건실례구동적사건추취방법.수선,종문당구자중추취출각화일개사건발생유대표성적특정,구성후선사건실례표시;기차,통과이원분류기대신문문본중적사건실례여비사건실례진행분류;최후,대사건실례채용기우층차취류적k-medoids산법완성사건추취.해방법불부극복료정반례실형이급수거희소문제,이차해결료예선정의사건유별적국한성.실험결과험증료해방법적유효성,대비전통방법,사건추취적준학솔여소회솔균획득료현저적제고.