中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2008年
1期
51-55,60
,共6页
计算机应用%中文信息处理%OPTICS算法%密度聚类%文本挖掘
計算機應用%中文信息處理%OPTICS算法%密度聚類%文本挖掘
계산궤응용%중문신식처리%OPTICS산법%밀도취류%문본알굴
基于密度的OPTICS聚类算法以可视化的结果输出方式直观呈现语料结构,但由于其结果组织策略在处理稀疏点时的局限性,算法实际性能未能得到充分发挥.本文针对此缺陷提出一种有效的结果重组织策略以辅助稀疏点的重新定位,并针对文本领域的特点改变距离度量方法,形成了OPTICS-Plus文本聚类算法.在真实文本分类语料上的实验表明,我们的结果重组织策略能够辅助算法产生更为清晰反映语料结构的可达图,与K-means算法的比较则证实了OPTICS-Plus具有较为良好的聚类性能.
基于密度的OPTICS聚類算法以可視化的結果輸齣方式直觀呈現語料結構,但由于其結果組織策略在處理稀疏點時的跼限性,算法實際性能未能得到充分髮揮.本文針對此缺陷提齣一種有效的結果重組織策略以輔助稀疏點的重新定位,併針對文本領域的特點改變距離度量方法,形成瞭OPTICS-Plus文本聚類算法.在真實文本分類語料上的實驗錶明,我們的結果重組織策略能夠輔助算法產生更為清晰反映語料結構的可達圖,與K-means算法的比較則證實瞭OPTICS-Plus具有較為良好的聚類性能.
기우밀도적OPTICS취류산법이가시화적결과수출방식직관정현어료결구,단유우기결과조직책략재처리희소점시적국한성,산법실제성능미능득도충분발휘.본문침대차결함제출일충유효적결과중조직책략이보조희소점적중신정위,병침대문본영역적특점개변거리도량방법,형성료OPTICS-Plus문본취류산법.재진실문본분류어료상적실험표명,아문적결과중조직책략능구보조산법산생경위청석반영어료결구적가체도,여K-means산법적비교칙증실료OPTICS-Plus구유교위량호적취류성능.