电网技术
電網技術
전망기술
POWER SYSTEM TECHNOLOGY
2014年
10期
2715-2720
,共6页
赵莉%候兴哲%胡君%傅宏%孙洪亮
趙莉%候興哲%鬍君%傅宏%孫洪亮
조리%후흥철%호군%부굉%손홍량
智能用电%云计算%Map-Reduce处理模型%k-means 算法%并行挖掘
智能用電%雲計算%Map-Reduce處理模型%k-means 算法%併行挖掘
지능용전%운계산%Map-Reduce처리모형%k-means 산법%병행알굴
intelligent power utilization%cloud-computing%Map-Reduce processing model%k-means algorithm%parallel mining
针对智能用电数据挖掘面临数据量大、挖掘效率低等难题,进行Map-Reduce模型下基于改进k-means的海量用电数据分析研究.以家庭用户为例,建立了家庭用户用电信息的家庭用户号、房屋面积、家庭成员数、每天用电量、峰谷电量、家用电器数等的数据维度模型,利用k-means算法简单、收敛速度快的优势,克服其容易陷入局部最优解的缺陷,综合考虑初始聚类中心的选择及聚类个数的选取2个因素,以数据对象密度的大小作为初始聚类中心的选取标准,将簇间距离及簇内对象的分散程度作为聚类数目选择的重要参考,对k-means算法进行改进;为提高数据处理效率,进行Map-Reduce处理模型下的海量家庭用户用电数据的并行挖掘.通过在Hadoop集群上进行实验,结果证明提出的算法运行稳定、高效、可行,且具有良好的加速比.
針對智能用電數據挖掘麵臨數據量大、挖掘效率低等難題,進行Map-Reduce模型下基于改進k-means的海量用電數據分析研究.以傢庭用戶為例,建立瞭傢庭用戶用電信息的傢庭用戶號、房屋麵積、傢庭成員數、每天用電量、峰穀電量、傢用電器數等的數據維度模型,利用k-means算法簡單、收斂速度快的優勢,剋服其容易陷入跼部最優解的缺陷,綜閤攷慮初始聚類中心的選擇及聚類箇數的選取2箇因素,以數據對象密度的大小作為初始聚類中心的選取標準,將簇間距離及簇內對象的分散程度作為聚類數目選擇的重要參攷,對k-means算法進行改進;為提高數據處理效率,進行Map-Reduce處理模型下的海量傢庭用戶用電數據的併行挖掘.通過在Hadoop集群上進行實驗,結果證明提齣的算法運行穩定、高效、可行,且具有良好的加速比.
침대지능용전수거알굴면림수거량대、알굴효솔저등난제,진행Map-Reduce모형하기우개진k-means적해량용전수거분석연구.이가정용호위례,건립료가정용호용전신식적가정용호호、방옥면적、가정성원수、매천용전량、봉곡전량、가용전기수등적수거유도모형,이용k-means산법간단、수렴속도쾌적우세,극복기용역함입국부최우해적결함,종합고필초시취류중심적선택급취류개수적선취2개인소,이수거대상밀도적대소작위초시취류중심적선취표준,장족간거리급족내대상적분산정도작위취류수목선택적중요삼고,대k-means산법진행개진;위제고수거처리효솔,진행Map-Reduce처리모형하적해량가정용호용전수거적병행알굴.통과재Hadoop집군상진행실험,결과증명제출적산법운행은정、고효、가행,차구유량호적가속비.