计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2007年
12期
332-335
,共4页
聊天室监控%词汇权重%话题识别
聊天室鑑控%詞彙權重%話題識彆
료천실감공%사회권중%화제식별
随着聊天室的广泛使用,对聊天内容监控也变成亟待解决的问题.在聊天室监控中,为衡量聊天数据中词汇对聊天内容的描述能力,现在一般直接采用文本词汇的权重计算方法;然而,这种方法忽视了聊天数据与静态文本结构上的差异,导致计算出的权重并不能准确反应词汇描述聊天内容的能力.针对聊天数据的固有特点,提出了一种专门针对聊天数据的词汇权重计算方法CDTF*IDF.该方法通过分别计算词汇在不同数据源中的权值并汇总、并对重点词汇提高权重等方式来计算聊天数据的词汇权重.基于IRC聊天室内容监控的实验表明:该方法能较好地衡量聊天词汇的权重,同时基于该方法的监控系统能够准确地识别出聊天数据中的话题.
隨著聊天室的廣汎使用,對聊天內容鑑控也變成亟待解決的問題.在聊天室鑑控中,為衡量聊天數據中詞彙對聊天內容的描述能力,現在一般直接採用文本詞彙的權重計算方法;然而,這種方法忽視瞭聊天數據與靜態文本結構上的差異,導緻計算齣的權重併不能準確反應詞彙描述聊天內容的能力.針對聊天數據的固有特點,提齣瞭一種專門針對聊天數據的詞彙權重計算方法CDTF*IDF.該方法通過分彆計算詞彙在不同數據源中的權值併彙總、併對重點詞彙提高權重等方式來計算聊天數據的詞彙權重.基于IRC聊天室內容鑑控的實驗錶明:該方法能較好地衡量聊天詞彙的權重,同時基于該方法的鑑控繫統能夠準確地識彆齣聊天數據中的話題.
수착료천실적엄범사용,대료천내용감공야변성극대해결적문제.재료천실감공중,위형량료천수거중사회대료천내용적묘술능력,현재일반직접채용문본사회적권중계산방법;연이,저충방법홀시료료천수거여정태문본결구상적차이,도치계산출적권중병불능준학반응사회묘술료천내용적능력.침대료천수거적고유특점,제출료일충전문침대료천수거적사회권중계산방법CDTF*IDF.해방법통과분별계산사회재불동수거원중적권치병회총、병대중점사회제고권중등방식래계산료천수거적사회권중.기우IRC료천실내용감공적실험표명:해방법능교호지형량료천사회적권중,동시기우해방법적감공계통능구준학지식별출료천수거중적화제.