计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2015年
1期
168-172
,共5页
文本分类%最近邻子空间搜索%最近邻搜索
文本分類%最近鄰子空間搜索%最近鄰搜索
문본분류%최근린자공간수색%최근린수색
text categorization%nearest subspace search%nearest neighbor search
在文本分类中,最近邻搜索算法具有思想简单、准确率高等优点,但通常在分类过程中的计算量较大.为克服这一不足,提出了一种基于最近邻子空间搜索的两类文本分类方法.首先提取每一类样本向量组的特征子空间,并通过映射将子空间变换为高维空间中的点,然后把最近邻子空间搜索转化为最近邻搜索完成分类过程.在Reuters-21578数据集上的实验表明,该方法能够有效提高文本分类的性能,具有较高的准确率、召回率和F1值.
在文本分類中,最近鄰搜索算法具有思想簡單、準確率高等優點,但通常在分類過程中的計算量較大.為剋服這一不足,提齣瞭一種基于最近鄰子空間搜索的兩類文本分類方法.首先提取每一類樣本嚮量組的特徵子空間,併通過映射將子空間變換為高維空間中的點,然後把最近鄰子空間搜索轉化為最近鄰搜索完成分類過程.在Reuters-21578數據集上的實驗錶明,該方法能夠有效提高文本分類的性能,具有較高的準確率、召迴率和F1值.
재문본분류중,최근린수색산법구유사상간단、준학솔고등우점,단통상재분류과정중적계산량교대.위극복저일불족,제출료일충기우최근린자공간수색적량류문본분류방법.수선제취매일류양본향량조적특정자공간,병통과영사장자공간변환위고유공간중적점,연후파최근린자공간수색전화위최근린수색완성분류과정.재Reuters-21578수거집상적실험표명,해방법능구유효제고문본분류적성능,구유교고적준학솔、소회솔화F1치.