%0 Journal Article %A 何丰 %A 罗建昌 %A 张承畅 %A 张华誉 %T 基于云计算和改进K-means算法的海量用电数据分析方法 %D 2018 %R 10.11772/j.issn.1001-9081.2017071660 %J 计算机应用 %P 159-164 %V 38 %N 1 %X 针对小区居民用电数据挖掘效率低、数据量大等难题,进行了基于云计算和改进K-means算法的海量用电数据分析方法研究。针对传统K-means算法中存在初始聚类中心和K值难确定的问题,提出一种基于密度的K-means改进算法。首先,定义样本密度、簇内样本平均距离的倒数和簇间距离三者乘积为权值积,通过最大权值积法依次确定聚类中心,提高了聚类的准确率;然后,基于MapReduce模型实现改进算法的并行化,提高了聚类的效率;最后,以小区400户家庭用电数据为基础,进行海量电力数据的挖掘分析实验。以家庭为单位,提取出用户的峰时耗电率、负荷率、谷电负荷系数以及平段用电量百分比,建立聚类的数据维度特征向量,完成相似用户类型的聚类,同时分析出各类用户的行为特征。基于Hadoop集群的实验结果证明提出的改进K-means算法运行稳定、可靠,具有很好的聚类效果。 %U http://www.joca.cn/CN/10.11772/j.issn.1001-9081.2017071660