信息网络安全
信息網絡安全
신식망락안전
NETINFO SECURITY
2014年
11期
30-35
,共6页
褒贬倾向性分类%文本特征选择%褒贬特征提取
褒貶傾嚮性分類%文本特徵選擇%褒貶特徵提取
포폄경향성분류%문본특정선택%포폄특정제취
appraisive classification%text feature selection%appraisive feature extracting
在当前的大数据时代,互联网上的博客、论坛产生了海量的主观性评论信息,这些评论信息表达了人们的各种情感色彩和情感倾向性。如果仅仅用人工的方法来对网络上海量的评论信息进行分类和处理实在是太难了,那么,如何高效地挖掘出网络上大量的具有褒贬倾向性观点的信息就成为目前亟待解决的问题,中文文本褒贬倾向性分类技术研究正是解决这一问题的一个方法。文章介绍了常用的文本特征选择算法,分析了文档频率和互信息算法的不足,通过对两个算法的对比和研究,结合文本特征与文本类型的相关度和文本褒贬特征的出现概率,提出了改进的文本特征选择算法(MIDF)。实验结果表明,MIDF 算法对文本褒贬倾向性分类是有效的。
在噹前的大數據時代,互聯網上的博客、論罈產生瞭海量的主觀性評論信息,這些評論信息錶達瞭人們的各種情感色綵和情感傾嚮性。如果僅僅用人工的方法來對網絡上海量的評論信息進行分類和處理實在是太難瞭,那麽,如何高效地挖掘齣網絡上大量的具有褒貶傾嚮性觀點的信息就成為目前亟待解決的問題,中文文本褒貶傾嚮性分類技術研究正是解決這一問題的一箇方法。文章介紹瞭常用的文本特徵選擇算法,分析瞭文檔頻率和互信息算法的不足,通過對兩箇算法的對比和研究,結閤文本特徵與文本類型的相關度和文本褒貶特徵的齣現概率,提齣瞭改進的文本特徵選擇算法(MIDF)。實驗結果錶明,MIDF 算法對文本褒貶傾嚮性分類是有效的。
재당전적대수거시대,호련망상적박객、론단산생료해량적주관성평론신식,저사평론신식표체료인문적각충정감색채화정감경향성。여과부부용인공적방법래대망락상해량적평론신식진행분류화처리실재시태난료,나요,여하고효지알굴출망락상대량적구유포폄경향성관점적신식취성위목전극대해결적문제,중문문본포폄경향성분류기술연구정시해결저일문제적일개방법。문장개소료상용적문본특정선택산법,분석료문당빈솔화호신식산법적불족,통과대량개산법적대비화연구,결합문본특정여문본류형적상관도화문본포폄특정적출현개솔,제출료개진적문본특정선택산법(MIDF)。실험결과표명,MIDF 산법대문본포폄경향성분류시유효적。
In the current era of big data, the Internet blog, forum produce a flood of subjective comment information which express various peoples’ color emotion and emotional tendency. It is so difficult to classify and process the massive comment information only by using the artificial methods, then how to efficiently dig out a lot of information that has appraisive views on the network has become an urgent problem at present. The research on Chinese text appraisive classification technology is the way to solve this problem. This article describes the common text feature selection algorithms, analyzes the shortcomings of document frequency and mutual information algorithm. By comparing and analyzing the two algorithms, combined with the relevance of text feature and text classification and the probability that the text feature appears, this article proposes an improved text feature selection algorithm(MIDF). The experimental results show that, MIDF is valid to the appraisive classification research.