江苏理工学院学报
江囌理工學院學報
강소리공학원학보
Journal of Jiangsu Teachers University of Technology
2015年
4期
26-31
,共6页
金微%吕萍%朱翠青%汪克峰
金微%呂萍%硃翠青%汪剋峰
금미%려평%주취청%왕극봉
聚类,K-means%SQL%关系数据库管理系统
聚類,K-means%SQL%關繫數據庫管理繫統
취류,K-means%SQL%관계수거고관리계통
clustering%K-means%SQL%relational DBMS
基于关系型数据库管理系统( DBMS)的数据挖掘算法对数据库程序员来说是一个很重要的问题.这里介绍了利用SQL实现的基于关系数据库管理系统的K-means聚类算法,将简单的K-means计算转化为SQL.实验证明,提出的K-means聚类算法可以对大型数据集进行聚类.将K-means算法分别用SQL和C+ +实现,比较相关的速度和可伸缩性,并且研究了在DBMS外输出数据集的时间.实验表明,SQL对于小型数据集还是很有效的,但对于大型数据集效率较低,而输出次数对于C+ +成为了一个瓶颈.
基于關繫型數據庫管理繫統( DBMS)的數據挖掘算法對數據庫程序員來說是一箇很重要的問題.這裏介紹瞭利用SQL實現的基于關繫數據庫管理繫統的K-means聚類算法,將簡單的K-means計算轉化為SQL.實驗證明,提齣的K-means聚類算法可以對大型數據集進行聚類.將K-means算法分彆用SQL和C+ +實現,比較相關的速度和可伸縮性,併且研究瞭在DBMS外輸齣數據集的時間.實驗錶明,SQL對于小型數據集還是很有效的,但對于大型數據集效率較低,而輸齣次數對于C+ +成為瞭一箇瓶頸.
기우관계형수거고관리계통( DBMS)적수거알굴산법대수거고정서원래설시일개흔중요적문제.저리개소료이용SQL실현적기우관계수거고관리계통적K-means취류산법,장간단적K-means계산전화위SQL.실험증명,제출적K-means취류산법가이대대형수거집진행취류.장K-means산법분별용SQL화C+ +실현,비교상관적속도화가신축성,병차연구료재DBMS외수출수거집적시간.실험표명,SQL대우소형수거집환시흔유효적,단대우대형수거집효솔교저,이수출차수대우C+ +성위료일개병경.
Data mining algorithms with a relational DBMS is an important problem for database programmers. We introduce SQL implementations of K-means clustering algorithm to integrate it with a relational DBMS, translate K-means computations into SQL. We experimentally show the proposed K-means can cluster large data sets. We compare K-means implementations in SQL and C+ + with respect to speed and scalability and we also study the time to export data sets outside of the DBMS. Experiments show that SQL overhead is significant for small data sets,but relatively low for large data sets,whereas export times become a bottleneck for C+ +.