昆明冶金高等专科学校学报
昆明冶金高等專科學校學報
곤명야금고등전과학교학보
JOURNAL OF KUNMING METALLURGY COLLEGE
2004年
4期
11-15
,共5页
文本分类%统计语义方法%亲和力%松散度%关键词集%关键词集树
文本分類%統計語義方法%親和力%鬆散度%關鍵詞集%關鍵詞集樹
문본분류%통계어의방법%친화력%송산도%관건사집%관건사집수
文本分类是指在给定的分类体系下,根据文本的内容自动地确定文本所属的类别.与当前的文本分类技术相比,统计语义方法描述了语义元的相互关系,定义了语义元间的亲和力、语义元集的松散度等.基于上述定义,给出了一种选取关键词集的方法,并用所获得的关键词集构造了关键词集树,完成了映射类别未知的文本的词集到关键词集树的分类过程.
文本分類是指在給定的分類體繫下,根據文本的內容自動地確定文本所屬的類彆.與噹前的文本分類技術相比,統計語義方法描述瞭語義元的相互關繫,定義瞭語義元間的親和力、語義元集的鬆散度等.基于上述定義,給齣瞭一種選取關鍵詞集的方法,併用所穫得的關鍵詞集構造瞭關鍵詞集樹,完成瞭映射類彆未知的文本的詞集到關鍵詞集樹的分類過程.
문본분류시지재급정적분류체계하,근거문본적내용자동지학정문본소속적유별.여당전적문본분류기술상비,통계어의방법묘술료어의원적상호관계,정의료어의원간적친화력、어의원집적송산도등.기우상술정의,급출료일충선취관건사집적방법,병용소획득적관건사집구조료관건사집수,완성료영사유별미지적문본적사집도관건사집수적분류과정.