科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2013年
33期
10003-10012
,共10页
数据挖掘%元素重要性%排序%选择%集合覆盖%分值
數據挖掘%元素重要性%排序%選擇%集閤覆蓋%分值
수거알굴%원소중요성%배서%선택%집합복개%분치
data mining%the importance of elements%sort%selection%set-cover%value
对给定数据集合的元素重要性进行估计是数据挖掘领域中的一项重要应用.现有的技术都是通过排序或选择来发现重要元素,其主要缺点是没考虑高排名对象可能非常相似甚至完全相同这一事实,忽略了高排名对象间的冗余性.因此,在强调多样性的场合,该方法性能有限.通过将排序和选择相结合,提出一种基于集合覆盖的元素重要性估计算法.该算法不仅考察单个集合覆盖的解,而且计算元素参与的高质量集合覆盖数量,进而为元素分配重要性分值.基于实际数据的实验和用户学习结果表明,算法性能高效,元素重要性评估结果的有用性高,且与人类感知相一致.
對給定數據集閤的元素重要性進行估計是數據挖掘領域中的一項重要應用.現有的技術都是通過排序或選擇來髮現重要元素,其主要缺點是沒攷慮高排名對象可能非常相似甚至完全相同這一事實,忽略瞭高排名對象間的冗餘性.因此,在彊調多樣性的場閤,該方法性能有限.通過將排序和選擇相結閤,提齣一種基于集閤覆蓋的元素重要性估計算法.該算法不僅攷察單箇集閤覆蓋的解,而且計算元素參與的高質量集閤覆蓋數量,進而為元素分配重要性分值.基于實際數據的實驗和用戶學習結果錶明,算法性能高效,元素重要性評估結果的有用性高,且與人類感知相一緻.
대급정수거집합적원소중요성진행고계시수거알굴영역중적일항중요응용.현유적기술도시통과배서혹선택래발현중요원소,기주요결점시몰고필고배명대상가능비상상사심지완전상동저일사실,홀략료고배명대상간적용여성.인차,재강조다양성적장합,해방법성능유한.통과장배서화선택상결합,제출일충기우집합복개적원소중요성고계산법.해산법불부고찰단개집합복개적해,이차계산원소삼여적고질량집합복개수량,진이위원소분배중요성분치.기우실제수거적실험화용호학습결과표명,산법성능고효,원소중요성평고결과적유용성고,차여인류감지상일치.