计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2012年
1期
119-121,125
,共4页
网络舆情监控%新词识别%分词词典
網絡輿情鑑控%新詞識彆%分詞詞典
망락여정감공%신사식별%분사사전
在网络舆情监控中,由于事件的突发性和网络词汇的泛滥,各种各样的新兴词汇以及新的字符串大量涌现,而有穷的分词词典对新词的识别基本上无能为力,这些无法识别的字符串将被现有的分词系统分为零散的碎片,这将极大地影响热点词和主题词提取的准确性,成为网络舆情监控系统性能提升的瓶颈.文中分析了当前主要的几种分词技术的优 缺点,利用网络舆情监控中未被词典收录的主题词的局部高频这一特性,通过计算异常分词与周围分词之间的粘结度,从而识别出未被词典收录的主题词.实验结果表明:所提出的分词算法能识别出未被词典收录的主题词,相比传统的分词算法,更加适合于网络舆情监控.
在網絡輿情鑑控中,由于事件的突髮性和網絡詞彙的汎濫,各種各樣的新興詞彙以及新的字符串大量湧現,而有窮的分詞詞典對新詞的識彆基本上無能為力,這些無法識彆的字符串將被現有的分詞繫統分為零散的碎片,這將極大地影響熱點詞和主題詞提取的準確性,成為網絡輿情鑑控繫統性能提升的瓶頸.文中分析瞭噹前主要的幾種分詞技術的優 缺點,利用網絡輿情鑑控中未被詞典收錄的主題詞的跼部高頻這一特性,通過計算異常分詞與週圍分詞之間的粘結度,從而識彆齣未被詞典收錄的主題詞.實驗結果錶明:所提齣的分詞算法能識彆齣未被詞典收錄的主題詞,相比傳統的分詞算法,更加適閤于網絡輿情鑑控.
재망락여정감공중,유우사건적돌발성화망락사회적범람,각충각양적신흥사회이급신적자부천대량용현,이유궁적분사사전대신사적식별기본상무능위력,저사무법식별적자부천장피현유적분사계통분위령산적쇄편,저장겁대지영향열점사화주제사제취적준학성,성위망락여정감공계통성능제승적병경.문중분석료당전주요적궤충분사기술적우 결점,이용망락여정감공중미피사전수록적주제사적국부고빈저일특성,통과계산이상분사여주위분사지간적점결도,종이식별출미피사전수록적주제사.실험결과표명:소제출적분사산법능식별출미피사전수록적주제사,상비전통적분사산법,경가괄합우망락여정감공.