中国民航大学学报
中國民航大學學報
중국민항대학학보
JOURNAL OF CIVIL AVIATION UNIVERSITY OF CHINA
2011年
3期
47-51
,共5页
文本聚类%潜在语义索引%奇异值分解%谱聚类
文本聚類%潛在語義索引%奇異值分解%譜聚類
문본취류%잠재어의색인%기이치분해%보취류
传统的文本聚类算法存在文本向量维度过高,算法易陷入局部最优问题.针对上述问题,提出了一种适用于文本的基于潜在语义索引的谱聚类方法,该方法应用了潜在语义索引和谱聚类方法的优点,不仅分析了词与词之间的语义关系,而且适用于任意形状分布的样本数据聚类.针对航空安全报告的聚类实验表明,该方法取得了较好的聚类效果.
傳統的文本聚類算法存在文本嚮量維度過高,算法易陷入跼部最優問題.針對上述問題,提齣瞭一種適用于文本的基于潛在語義索引的譜聚類方法,該方法應用瞭潛在語義索引和譜聚類方法的優點,不僅分析瞭詞與詞之間的語義關繫,而且適用于任意形狀分佈的樣本數據聚類.針對航空安全報告的聚類實驗錶明,該方法取得瞭較好的聚類效果.
전통적문본취류산법존재문본향량유도과고,산법역함입국부최우문제.침대상술문제,제출료일충괄용우문본적기우잠재어의색인적보취류방법,해방법응용료잠재어의색인화보취류방법적우점,불부분석료사여사지간적어의관계,이차괄용우임의형상분포적양본수거취류.침대항공안전보고적취류실험표명,해방법취득료교호적취류효과.