阜阳师范学院学报:自然科学版
阜暘師範學院學報:自然科學版
부양사범학원학보:자연과학판
Journal of Fuyang Teachers College:Natural Science
2012年
4期
60-63,77
,共5页
共现词对%文档表示%向量空间模型%特征选择
共現詞對%文檔錶示%嚮量空間模型%特徵選擇
공현사대%문당표시%향량공간모형%특정선택
word co-occurrence%document representation%VSM%feature selection
提出一种新的文档表示模型——基于共现词对的向量空间模型。模型以文档中共现的词对为基本考察对象,通过统计学特征选择有代表性的词对来表示文档。基于覆盖算法的文本分类实验表明此模型有较强的文档表示效果,为文本自动化处理提供了一条新思路。
提齣一種新的文檔錶示模型——基于共現詞對的嚮量空間模型。模型以文檔中共現的詞對為基本攷察對象,通過統計學特徵選擇有代錶性的詞對來錶示文檔。基于覆蓋算法的文本分類實驗錶明此模型有較彊的文檔錶示效果,為文本自動化處理提供瞭一條新思路。
제출일충신적문당표시모형——기우공현사대적향량공간모형。모형이문당중공현적사대위기본고찰대상,통과통계학특정선택유대표성적사대래표시문당。기우복개산법적문본분류실험표명차모형유교강적문당표시효과,위문본자동화처리제공료일조신사로。
A new document representation model, a vector space model based on word co-occurrence(VSMBWC) is presen- ted in this article, which uses the co-occurring word pairs as the basic inspection object, and selects typical word pairs to represent document in statistical method. The text classification experiments based on cross cover algorithm show that this model is better in document representation, and provide a new way of thinking for text automatic processing.