摘要: 平面波赝势密度泛函(PWP-DFT)计算是材料计算中应用最广泛的方法,其中映射计算是PWP-DFT方法求解自洽迭代中重要的一部分。针对映射势能计算成为软件加速的瓶颈,提出了针对该部分的图形处理器(GPU)加速算法,其中考虑GPU的特点:1)使用了新的并行机制求解非局部映射势能;2)重新设计了数据分布结构;3)减少内存的使用;4)提出了一种解决算法中数据相关问题的方法。最终获得了18~57倍加速,使每步分子动力学模拟最终降为12s。详细分析了该模块在GPU平台上的测试时间,同时对该算法在GPU集群上的计算瓶颈进行了讨论。
中图分类号:
付继芸 贾伟乐 曹宗雁 王龙 叶煌 迟学斌. GPU集群下第一原理非局部映射势能计算[J]. 计算机应用, 2013, 33(06): 1540-1552.
FU Jiyun JIA Weile CAO Zongyan WANG Long YE Huang CHI Xuebin. First-principle nonlocal projector potential calculation on GPU cluster[J]. Journal of Computer Applications, 2013, 33(06): 1540-1552.