山西大学学报(自然科学版)
山西大學學報(自然科學版)
산서대학학보(자연과학판)
JOURNAL OF SHANXI UNIVERSITY
1999年
2期
144-149
,共6页
文本分类%中文文本自动分类%字频向量%基于实例的映射函数%语料库%汉字
文本分類%中文文本自動分類%字頻嚮量%基于實例的映射函數%語料庫%漢字
문본분류%중문문본자동분류%자빈향량%기우실례적영사함수%어료고%한자
提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法.该方法采用汉字字频向量作为文本的表示方法.它的显著特点是引入线性最小二乘方估计(Linear Least Square Fil, LLSF)技术建立文本分类器模型,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习,实现了基于全局最小错误率的汉字--类别两个向量空间的映射函数,并用该函数对测试文本进行分类.
提齣瞭一種根據漢字統計特性和基于實例映射的中文文本自動分類方法.該方法採用漢字字頻嚮量作為文本的錶示方法.它的顯著特點是引入線性最小二乘方估計(Linear Least Square Fil, LLSF)技術建立文本分類器模型,通過對訓練集語料的手工分類標引以及對文本和類彆間的相關性判定的學習,實現瞭基于全跼最小錯誤率的漢字--類彆兩箇嚮量空間的映射函數,併用該函數對測試文本進行分類.
제출료일충근거한자통계특성화기우실례영사적중문문본자동분류방법.해방법채용한자자빈향량작위문본적표시방법.타적현저특점시인입선성최소이승방고계(Linear Least Square Fil, LLSF)기술건립문본분류기모형,통과대훈련집어료적수공분류표인이급대문본화유별간적상관성판정적학습,실현료기우전국최소착오솔적한자--유별량개향량공간적영사함수,병용해함수대측시문본진행분류.