华侨大学学报(自然科学版)
華僑大學學報(自然科學版)
화교대학학보(자연과학판)
JOURNAL OF HUAQIAO UNIVERSITY(NATURAL SCIENCE)
2015年
3期
292-296
,共5页
旅游大数据%MapReduce模型%聚类%客户细分
旅遊大數據%MapReduce模型%聚類%客戶細分
여유대수거%MapReduce모형%취류%객호세분
tourism big data%MapReduce model%clustering%customer segmentation
分析K-means聚类算法和 Hadoop云平台的特点,对聚类算法进行改进,给出算法的 MapReduce 实现。通过加速比实验和旅游数据细分实验,验证了算法的有效性和高可扩展性。针对旅游大数据的特点,构建了多指标的RFM扩展模型,通过文中算法聚类,得到与预期相近的聚类结果。实验结果表明:文中算法具有较高的实用价值。
分析K-means聚類算法和 Hadoop雲平檯的特點,對聚類算法進行改進,給齣算法的 MapReduce 實現。通過加速比實驗和旅遊數據細分實驗,驗證瞭算法的有效性和高可擴展性。針對旅遊大數據的特點,構建瞭多指標的RFM擴展模型,通過文中算法聚類,得到與預期相近的聚類結果。實驗結果錶明:文中算法具有較高的實用價值。
분석K-means취류산법화 Hadoop운평태적특점,대취류산법진행개진,급출산법적 MapReduce 실현。통과가속비실험화여유수거세분실험,험증료산법적유효성화고가확전성。침대여유대수거적특점,구건료다지표적RFM확전모형,통과문중산법취류,득도여예기상근적취류결과。실험결과표명:문중산법구유교고적실용개치。
First,the characteristic of K-means clustering algorithm and Hadoop cloud platform is analyzed in this paper, the improvement of K-means clustering algorithm and its implementation of MapReduce are given.Then,the experiments of speedup and tourist segmentation are given to illustrate the effectiveness and the high scalability of the proposed meth-od.Finally,according to the characteristics of tourism big data,a multi index RFM model is built,the clustering results which are expected indicate that the algorithm is highly practical.