通信学报
通信學報
통신학보
JOURNAL OF CHINA INSTITUTE OF COMMUNICATIONS
2007年
12期
141-146
,共6页
热点信息发现%未登录词识别%切分词拼接
熱點信息髮現%未登錄詞識彆%切分詞拼接
열점신식발현%미등록사식별%절분사병접
为了有效挖掘海量网络数据中的热点信息,设计了网络热点信息发现算法.基于多级滤噪进行切分词拼接,利用特定的噪声库与多级滤噪策略严格控制拼接过程,挑选合理的收录策略,提取出能够准确反映海量网络数据中热门事件的热点信息串.在TDT国际标准评测语料上算法表现出令人满意的性能.
為瞭有效挖掘海量網絡數據中的熱點信息,設計瞭網絡熱點信息髮現算法.基于多級濾譟進行切分詞拼接,利用特定的譟聲庫與多級濾譟策略嚴格控製拼接過程,挑選閤理的收錄策略,提取齣能夠準確反映海量網絡數據中熱門事件的熱點信息串.在TDT國際標準評測語料上算法錶現齣令人滿意的性能.
위료유효알굴해량망락수거중적열점신식,설계료망락열점신식발현산법.기우다급려조진행절분사병접,이용특정적조성고여다급려조책략엄격공제병접과정,도선합리적수록책략,제취출능구준학반영해량망락수거중열문사건적열점신식천.재TDT국제표준평측어료상산법표현출령인만의적성능.