计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2012年
30期
28-32
,共5页
文本分类%标点符号%语言自然节奏%状态转移
文本分類%標點符號%語言自然節奏%狀態轉移
문본분류%표점부호%어언자연절주%상태전이
大规模文体分类是一个非常复杂的任务.提出了一种基于语言自然节奏的文本分类方法,通过对语言中标点标记的自然节奏进行分析,获取其特征,应用贝叶斯分类器,可以快速高效地完成文本分类任务.这种文本分类方法与当前主流基于词条特征的文本分类方法不同,不需要理解和分析语义,即无需分析文章中的词条,特征空间小,数据稀疏性现象不明显,文本分类效果显著.
大規模文體分類是一箇非常複雜的任務.提齣瞭一種基于語言自然節奏的文本分類方法,通過對語言中標點標記的自然節奏進行分析,穫取其特徵,應用貝葉斯分類器,可以快速高效地完成文本分類任務.這種文本分類方法與噹前主流基于詞條特徵的文本分類方法不同,不需要理解和分析語義,即無需分析文章中的詞條,特徵空間小,數據稀疏性現象不明顯,文本分類效果顯著.
대규모문체분류시일개비상복잡적임무.제출료일충기우어언자연절주적문본분류방법,통과대어언중표점표기적자연절주진행분석,획취기특정,응용패협사분류기,가이쾌속고효지완성문본분류임무.저충문본분류방법여당전주류기우사조특정적문본분류방법불동,불수요리해화분석어의,즉무수분석문장중적사조,특정공간소,수거희소성현상불명현,문본분류효과현저.