北京理工大学学报
北京理工大學學報
북경리공대학학보
JOURNAL OF BEIJING INSTITUTE OF TECHNOLOGY
2010年
3期
315-319
,共5页
扩散核%核近邻%狄利克雷混合多项式%文本分类
擴散覈%覈近鄰%狄利剋雷混閤多項式%文本分類
확산핵%핵근린%적리극뢰혼합다항식%문본분류
为了更加高效地对文本数据进行描述,提出将文本向量表示为统计流形上的点,并用核方法将文本的生成模型和判别模型结合起来.用DCM统计流形上扩散核来表示文本空间上的距离度量,提出DCM流形上的核近邻算法用于文本分类.实验结果表明,在两个实验语料库上基于DCM流形的核近邻算法的准确率和召回率优于对比算法或与对比算法相当.
為瞭更加高效地對文本數據進行描述,提齣將文本嚮量錶示為統計流形上的點,併用覈方法將文本的生成模型和判彆模型結閤起來.用DCM統計流形上擴散覈來錶示文本空間上的距離度量,提齣DCM流形上的覈近鄰算法用于文本分類.實驗結果錶明,在兩箇實驗語料庫上基于DCM流形的覈近鄰算法的準確率和召迴率優于對比算法或與對比算法相噹.
위료경가고효지대문본수거진행묘술,제출장문본향량표시위통계류형상적점,병용핵방법장문본적생성모형화판별모형결합기래.용DCM통계류형상확산핵래표시문본공간상적거리도량,제출DCM류형상적핵근린산법용우문본분류.실험결과표명,재량개실험어료고상기우DCM류형적핵근린산법적준학솔화소회솔우우대비산법혹여대비산법상당.