期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 求解最大团问题的并行多层图划分方法
顾军华, 霍士杰, 武君艳, 尹君, 张素琪
计算机应用    2018, 38 (12): 3425-3432.   DOI: 10.11772/j.issn.1001-9081.2018040934
摘要648)      PDF (1254KB)(436)    收藏
在当今大数据环境下,针对图中节点的海量性和分析的复杂性对最大团问题的研究在速度和精度上都提出了更高要求的问题,提出求解最大团问题的并行多层图划分方法(PMGP_SMC)。首先,提出一种新的多层图划分(MGP)方法,在保持原有图的团结构不被破坏的情况下对大规模图例划分产生子图,并对规模较大的子图进行多层图划分,进一步缩小子图规模,并且应用GraphX图计算框架实现MGP,形成并行MGP(PMGP)方法;然后,依据划分后的子图规模,减少了惩罚值局部搜索算法(PBLS)的迭代次数,提出基于速度优化的PBLS(SPBLS)来求解划分后的各个子图的最大团;最后,将PMGP和SPBLS相结合形成PMGP_SMC。采用Stanford大规模数据集运行测试,实验结果表明,PMGP相比并行单层图划分方法(PSGP),求得的最大子图规模能缩小至原来的1/100,平均子图规模能缩小至原来的1/2;PMGP_SMC相比求解最大团问题的PSGP(PSGP_SMC),总体时间缩短至原来的1/100,并且PMGP_SMC求解最大团的精度和基于极大团枚举求解最大团问题的并行多层图划分方法(PMGP_MCE)一致。PMGP_SMC能够快速精准地求解大规模图例的最大团。
参考文献 | 相关文章 | 多维度评价
2. 基于Spark的并行FP-Growth算法优化及实现
顾军华, 武君艳, 许馨匀, 谢志坚, 张素琪
计算机应用    2018, 38 (11): 3069-3074.   DOI: 10.11772/j.issn.1001-9081.2018041219
摘要1052)      PDF (928KB)(723)    收藏
为了进一步提高在Spark平台上的频繁模式增长(FP-Growth)算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树(FP-Tree)规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然后,通过创建列表P-List对数据集划分策略进行优化,减少遍历次数,降低时间复杂度。实验结果表明,BFPG算法提高了并行FP-Growth算法挖掘效率,且算法具有良好的扩展性。
参考文献 | 相关文章 | 多维度评价