电子学报
電子學報
전자학보
ACTA ELECTRONICA SINICA
2008年
8期
1626-1630
,共5页
戴新宇%田宝明%周俊生%陈家骏
戴新宇%田寶明%週俊生%陳傢駿
대신우%전보명%주준생%진가준
直推式谱图%潜在语义分析%文本分类%图构造
直推式譜圖%潛在語義分析%文本分類%圖構造
직추식보도%잠재어의분석%문본분류%도구조
本文针对训练数据较少以及在基于图的分类算法中的文本表示问题,提出了一种基于潜在语义分析技术和直推式谱图算法的文本分类方法LSASGT,该方法将潜在语义分析技术和直推式谱图算法这两种基于谱分析理论的技术有机地结合在一起,对所有训练数据和测试数据进行统一建模,挖掘数据中潜在的多种结构信息.LfiASGT引入潜在语义分析技术用于构造文本图表示模型,在能够反映人的分类标准的潜在语义特征空间中,描述文本之间的语义相关性;基于这样的文本表示,利用半监督的直推式谱图算法进行文本分类.在基准英文文本分类数据集Reutera21578和中文文本分类数据集Tan-Corp上的实验结果表明,本文给出的LSASGT文本分类方法获得了较好的分类结果.
本文針對訓練數據較少以及在基于圖的分類算法中的文本錶示問題,提齣瞭一種基于潛在語義分析技術和直推式譜圖算法的文本分類方法LSASGT,該方法將潛在語義分析技術和直推式譜圖算法這兩種基于譜分析理論的技術有機地結閤在一起,對所有訓練數據和測試數據進行統一建模,挖掘數據中潛在的多種結構信息.LfiASGT引入潛在語義分析技術用于構造文本圖錶示模型,在能夠反映人的分類標準的潛在語義特徵空間中,描述文本之間的語義相關性;基于這樣的文本錶示,利用半鑑督的直推式譜圖算法進行文本分類.在基準英文文本分類數據集Reutera21578和中文文本分類數據集Tan-Corp上的實驗結果錶明,本文給齣的LSASGT文本分類方法穫得瞭較好的分類結果.
본문침대훈련수거교소이급재기우도적분류산법중적문본표시문제,제출료일충기우잠재어의분석기술화직추식보도산법적문본분류방법LSASGT,해방법장잠재어의분석기술화직추식보도산법저량충기우보분석이론적기술유궤지결합재일기,대소유훈련수거화측시수거진행통일건모,알굴수거중잠재적다충결구신식.LfiASGT인입잠재어의분석기술용우구조문본도표시모형,재능구반영인적분류표준적잠재어의특정공간중,묘술문본지간적어의상관성;기우저양적문본표시,이용반감독적직추식보도산법진행문본분류.재기준영문문본분류수거집Reutera21578화중문문본분류수거집Tan-Corp상적실험결과표명,본문급출적LSASGT문본분류방법획득료교호적분류결과.