计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2008年
9期
1477-1485
,共9页
吕宗磊%王建东%李莹%宰云峰
呂宗磊%王建東%李瑩%宰雲峰
려종뢰%왕건동%리형%재운봉
数据挖掘%机器学习%聚类%聚类评价%模态逻辑
數據挖掘%機器學習%聚類%聚類評價%模態邏輯
수거알굴%궤기학습%취류%취류평개%모태라집
聚类评价指标对衡量一个聚类的优劣有着重要作用.现有的聚类评价指标通常都基于统计理论或模糊理论.收到基础理论的限制,在一些特殊场合,这些指标不能对聚类进行正确的评估.提出了一种基于模态逻辑的新的聚类评价指标.通过把相似性定义成数据集上的二元关系聚类被描述成Kripke结构.用原子公式表示每个簇后,聚类的结果可以用一组逻辑公式来表示.根据最小描述长度原则,聚类评价指标由这种表示方式的准确性和复杂性构成.由于这种新的评价指标对相似性没有任何附加的限制,它较之现有的评价指标更为通用,而那些指标往往都默认了某种相似性度量方式.列举了用于对比新旧指标的实验.实验结果表明,这种新的评价指标在一般情况下与大多数评价指标一致,而在一些类似"双环"的特殊情况下比现有评价方式更有效.
聚類評價指標對衡量一箇聚類的優劣有著重要作用.現有的聚類評價指標通常都基于統計理論或模糊理論.收到基礎理論的限製,在一些特殊場閤,這些指標不能對聚類進行正確的評估.提齣瞭一種基于模態邏輯的新的聚類評價指標.通過把相似性定義成數據集上的二元關繫聚類被描述成Kripke結構.用原子公式錶示每箇簇後,聚類的結果可以用一組邏輯公式來錶示.根據最小描述長度原則,聚類評價指標由這種錶示方式的準確性和複雜性構成.由于這種新的評價指標對相似性沒有任何附加的限製,它較之現有的評價指標更為通用,而那些指標往往都默認瞭某種相似性度量方式.列舉瞭用于對比新舊指標的實驗.實驗結果錶明,這種新的評價指標在一般情況下與大多數評價指標一緻,而在一些類似"雙環"的特殊情況下比現有評價方式更有效.
취류평개지표대형량일개취류적우렬유착중요작용.현유적취류평개지표통상도기우통계이론혹모호이론.수도기출이론적한제,재일사특수장합,저사지표불능대취류진행정학적평고.제출료일충기우모태라집적신적취류평개지표.통과파상사성정의성수거집상적이원관계취류피묘술성Kripke결구.용원자공식표시매개족후,취류적결과가이용일조라집공식래표시.근거최소묘술장도원칙,취류평개지표유저충표시방식적준학성화복잡성구성.유우저충신적평개지표대상사성몰유임하부가적한제,타교지현유적평개지표경위통용,이나사지표왕왕도묵인료모충상사성도량방식.열거료용우대비신구지표적실험.실험결과표명,저충신적평개지표재일반정황하여대다수평개지표일치,이재일사유사"쌍배"적특수정황하비현유평개방식경유효.