软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2013年
10期
2366-2378
,共13页
仲兆满%李存华%刘宗田%戴红伟
仲兆滿%李存華%劉宗田%戴紅偉
중조만%리존화%류종전%대홍위
事件多要素检索%Web新闻%事件检索模型%相关性计算
事件多要素檢索%Web新聞%事件檢索模型%相關性計算
사건다요소검색%Web신문%사건검색모형%상관성계산
multi-event elements retrieval%Web news%event retrieval model%relevance computing
针对用户获取事件类信息的需求,在分析Web新闻特征、事件多要素检索特点的基础上,研究了面向Web新闻的事件多要素检索方法.首先,提出了面向Web新闻的事件多要素检索模型;然后,使用BNF(Backus-Naur form)形式化定义了事件多要素查询项;最后,结合事件的动作要素、Web新闻标题的重要性及事件项与约束项之间的距离,提出了事件查询项与文档相关性的计算方法.设置了16个事件多要素查询项,基于Baidu搜索引擎对P@n指标进行了实验分析,所提方法得到的平均P@10结果为0.87,平均P@20结果为0.83.对16个事件查询主题,通过人工标注语料的方法对F-measure指标进行了实验分析,所提方法得到的平均F-measure为0.74.结果表明,所提方法对事件多要素的检索较为有效.
針對用戶穫取事件類信息的需求,在分析Web新聞特徵、事件多要素檢索特點的基礎上,研究瞭麵嚮Web新聞的事件多要素檢索方法.首先,提齣瞭麵嚮Web新聞的事件多要素檢索模型;然後,使用BNF(Backus-Naur form)形式化定義瞭事件多要素查詢項;最後,結閤事件的動作要素、Web新聞標題的重要性及事件項與約束項之間的距離,提齣瞭事件查詢項與文檔相關性的計算方法.設置瞭16箇事件多要素查詢項,基于Baidu搜索引擎對P@n指標進行瞭實驗分析,所提方法得到的平均P@10結果為0.87,平均P@20結果為0.83.對16箇事件查詢主題,通過人工標註語料的方法對F-measure指標進行瞭實驗分析,所提方法得到的平均F-measure為0.74.結果錶明,所提方法對事件多要素的檢索較為有效.
침대용호획취사건류신식적수구,재분석Web신문특정、사건다요소검색특점적기출상,연구료면향Web신문적사건다요소검색방법.수선,제출료면향Web신문적사건다요소검색모형;연후,사용BNF(Backus-Naur form)형식화정의료사건다요소사순항;최후,결합사건적동작요소、Web신문표제적중요성급사건항여약속항지간적거리,제출료사건사순항여문당상관성적계산방법.설치료16개사건다요소사순항,기우Baidu수색인경대P@n지표진행료실험분석,소제방법득도적평균P@10결과위0.87,평균P@20결과위0.83.대16개사건사순주제,통과인공표주어료적방법대F-measure지표진행료실험분석,소제방법득도적평균F-measure위0.74.결과표명,소제방법대사건다요소적검색교위유효.