计算机应用 ›› 2014, Vol. 34 ›› Issue (8): 2175-2178.DOI: 10.11772/j.issn.1001-9081.2014.08.2175
• 第五届中国数据挖掘会议(CCDM 2014)论文 • 上一篇 下一篇
章志刚,吉根林,唐梦梦
收稿日期:
2014-04-30
修回日期:
2014-05-10
发布日期:
2014-08-10
出版日期:
2014-08-01
通讯作者:
吉根林
作者简介:
基金资助:
江苏省自然科学基金资助项目
ZHANG Zhigang,JI Genlin,TANG Mengmeng
Received:
2014-04-30
Revised:
2014-05-10
Online:
2014-08-10
Published:
2014-08-01
Contact:
JI Genlin
摘要:
针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。
中图分类号:
章志刚 吉根林 唐梦梦. 并行挖掘频繁项目集新算法——MREclat[J]. 计算机应用, 2014, 34(8): 2175-2178.
ZHANG Zhigang JI Genlin TANG Mengmeng. MREclat: new algorithm for parallel mining frequent itemsets[J]. Journal of Computer Applications, 2014, 34(8): 2175-2178.
[1]LIBEN-NOWELL D, KLEINBERG J. The link prediction problem for social networks [J]. Journal of the American Society for Information Science and Technology, 2007, 58(7): 1019-1031. |
[1] | 高威 刘丽华 和斌涛 邓方安. 区块链共识机制与改进算法研究进展[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 陈姿芊, 牛科迪, 姚中原, 斯雪明. 适用于物联网的区块链轻量化技术综述[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3688-3698. |
[3] | 高婷婷, 姚中原, 贾淼, 斯雪明. 链上链下一致性保护技术综述[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3658-3668. |
[4] | 贾淼, 姚中原, 祝卫华, 高婷婷, 斯雪明, 邓翔. 零知识证明赋能区块链的进展与展望[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3669-3677. |
[5] | 牛科迪, 李敏, 姚中原, 斯雪明. 面向物联网的区块链共识算法综述[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3678-3687. |
[6] | 杨巍 白璐 宁俊义 董建军 单春海 信俊昌. 异构环境感知的幂律图流划分方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[7] | 秦学程 刘春颜 李宝 赵蕴龙. 面向工业场景的云边协同数据存储与检索架构[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[8] | 蒋辉, 闫秋艳, 姜竹郡. 面向多元时间序列异常检测的对称正定自编码器方法[J]. 《计算机应用》唯一官方网站, 2024, 44(10): 3294-3299. |
[9] | 宋洪涛, 于江生, 韩启龙. 工业多元时序数据质量评估方法[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1743-1750. |
[10] | 孟玉飞, 武优西, 王珍, 李艳. 对比保序模式挖掘算法[J]. 《计算机应用》唯一官方网站, 2023, 43(12): 3740-3746. |
[11] | 王佳鑫, 颜嘉麒, 毛谦昂. 加密数字货币监管技术研究综述[J]. 《计算机应用》唯一官方网站, 2023, 43(10): 2983-2995. |
[12] | 黄硕, 李艳辉, 曹建秋. 本地化差分隐私下的频繁序列模式挖掘算法PrivSPM[J]. 《计算机应用》唯一官方网站, 2023, 43(7): 2057-2064. |
[13] | 金泳, 高扬华, 潘晓华, 沈诗婧, 朱心洲. 采用数据血缘的数据热度预测方法[J]. 《计算机应用》唯一官方网站, 2023, 43(S1): 119-125. |
[14] | 马志峰, 于俊洋, 王龙葛. 多样性表示的深度子空间聚类算法[J]. 《计算机应用》唯一官方网站, 2023, 43(2): 407-412. |
[15] | 王旭, 申玉民, 熊晓芸, 李鹏, 王金龙. 基于哈希图的建筑物联网数据管理方法[J]. 《计算机应用》唯一官方网站, 2022, 42(8): 2471-2480. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||