栏目文章信息

    2019年全国开放式分布与并行计算学术年会(DPCS 2019)论文 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 面向期限感知分布式矩阵相乘的高效存储方案
    赵永柱, 黎卫东, 唐斌, 梅峰, 卢文达
    《计算机应用》唯一官方网站    2020, 40 (2): 311-315.   DOI: 10.11772/j.issn.1001-9081.2019091640
    摘要457)   HTML15)    PDF (742KB)(542)    收藏

    分布式矩阵相乘是众多分布式机器学习、科学计算等应用中的关键操作,但其性能会受到系统中常见的落后节点的严重影响。最近研究者提出了基于喷泉码的编码矩阵相乘方法,能够充分利用落后节点的部分计算结果,从而大幅度减轻落后节点问题,但忽略了工作节点的存储开销。在考虑存储开销与计算完成时间之间的权衡关系的基础上,首先提出了面向异构工作节点的计算期限感知的存储优化问题;然后进一步通过理论分析,提出了基于期望近似的解决思路,并通过松弛将问题转化为凸优化问题以方便高效求解。仿真实验表明,在保证较大的任务成功率的情况下,所提方案的存储开销会随着任务期限的放宽迅速下降,并且该方案能够更大幅度降低编码带来的存储开销。也就是说,所提方案能够在保障整体计算在期限内大概率完成的前提下,大幅度降低总体的额外存储负载。

    图表 | 参考文献 | 相关文章 | 多维度评价
    2. 基于远程直接内存访问的高性能键值存储系统
    王成, 叶保留, 梅峰, 卢文达
    《计算机应用》唯一官方网站    2020, 40 (2): 316-320.   DOI: 10.11772/j.issn.1001-9081.2019091635
    摘要380)   HTML4)    PDF (613KB)(565)    收藏

    随着数据与系统规模的不断扩大,网络传输成为了键值存储系统的性能瓶颈。同时,远程直接内存访问(RDMA)技术能够支持高带宽和低时延的数据传输,为键值存储系统设计提供了新的思路。结合高性能网络中的RDMA技术,设计并实现了高性能、低CPU负载的键值存储系统Chequer;结合RDMA原语的特性,重新设计了键值存储系统的基本操作工作流程;并设计了基于线性探测的共享hash表,解决客户端缓存失效的问题以及提高hash命中率来减少客户端的读取轮数,进一步提高了系统的性能。在小规模集群上实现了Chequer系统,并通过实验验证了其性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    3. 基于增量学习的RocksDB键值系统主动缓存机制
    骆克云, 叶保留, 唐斌, 梅峰, 卢文达
    《计算机应用》唯一官方网站    2020, 40 (2): 321-327.   DOI: 10.11772/j.issn.1001-9081.2019091616
    摘要406)   HTML2)    PDF (723KB)(356)    收藏

    由于分层结构的约束,基于日志结构合并(LSM)树的RocksDB键值存储系统面临着读取性能低下的问题。一种有效的解决方法是对热点数据进行主动缓存,但其面临两个挑战:一是如何在数据分布持续动态变化时对热点数据进行预测,二是如何将主动缓存机制与RocksDB存储结构衔接起来。针对这些挑战,基于预测分析技术,构建了由数据采集、系统交互、系统测试等部分组成的面向RocksDB键值系统的主动缓存框架,能够将热点数据缓存在LSM树的较低层级中;并对数据访问模式进行建模,设计并实现了基于增量学习的热点数据预测分析方法,能够有效减少存储介质的I/O访问次数。实验结果表明该机制能有效提升RocksDB在不同动态工作负载下的数据读取性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    4. 基于多微云协作的计算任务卸载
    王庆永, 毛莺池, 王绎超, 王龙宝
    《计算机应用》唯一官方网站    2020, 40 (2): 328-334.   DOI: 10.11772/j.issn.1001-9081.2019081367
    摘要402)   HTML0)    PDF (800KB)(286)    收藏

    针对多微云计算模式下计算任务卸载过程复杂、任务响应时间长的问题,构建面向多微云协作的计算任务卸载模型,并提出加权自适应惯性权重的粒子群优化(WAIW-PSO)算法,快速求解最优卸载策略。首先,对移动终端-微云-远程云的任务执行过程进行建模;其次,考虑多用户对计算资源的竞争,构建基于多微云协作的任务卸载模型;最后,针对求解最佳任务卸载策略复杂度过高的情况,提出WAIW-PSO算法求解卸载问题。仿真实验结果表明,与标准粒子群优化(PSO)算法以及基于高斯函数递减惯性权重的粒子群优化(GDIWPSO)算法相比,WAIW-PSO算法可以根据进化代数和个体适应度综合调整惯性权重,寻优能力较强,求解最优卸载策略的时间最短;在不同设备数、任务数等情况下选择不同任务卸载策略进行对比实验的结果表明,基于WAIW-PSO算法的卸载策略可以明显缩短任务总完成时间。

    图表 | 参考文献 | 相关文章 | 多维度评价
    5. 基于DPDK并行通信的动态监控模型
    李翠, 陈庆奎
    《计算机应用》唯一官方网站    2020, 40 (2): 335-341.   DOI: 10.11772/j.issn.1001-9081.2019081405
    摘要390)   HTML2)    PDF (846KB)(264)    收藏

    为了更好地发挥通信系统的性能,充分利用系统节点的资源,提高系统的可靠性与稳定性,设计了一种基于DPDK并行通信的动态监控模型。该模型结合DPDK和通信系统的高速率、大流量、强实时性等特点,面向多节点备份、数据包与控制包分离、多网口并行收发数据包、多核并行处理数据包进行设计,分析了监控对象,研究了数据采集方法,设计了二层通信协议DMPD,并对网口进行了细粒度监控,给出了网口负载信息模型。另外,将散列函数、调整函数与动态负载信息结合起来设计了更有效、更公平的基于多网口的动态负载均衡算法。实验结果表明,该监控模型能够准确检测和及时处理系统出现的异常,并且实现了多网口的动态负载均衡。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 基于边缘计算的分支神经网络模型推断延迟优化
    樊琦, 李卓, 陈昕
    《计算机应用》唯一官方网站    2020, 40 (2): 342-346.   DOI: 10.11772/j.issn.1001-9081.2019081406
    摘要439)   HTML0)    PDF (629KB)(450)    收藏

    针对云服务器上深度神经网络(DNN)模型推断任务延迟过高的问题,提出基于边缘计算的分支神经网络部署模型。分析了边缘计算场景中深度神经网络的分布式部署问题,证明该问题是NP-难的。设计了一种基于分支定界思想的部署算法(DBB),选择合适的边缘计算节点部署模型以减少推断任务的延迟。设计并实现了选择节点退出(SNE)算法,为不同任务选择合适的边缘计算节点来退出推断任务。仿真实验结果表明,与在云端部署神经网络模型的方法相比,基于边缘计算的分支神经网络模型的推断延迟平均降低了36%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    7. 基于随机森林和遗传算法的Ceph参数自动调优
    陈禹, 毛莺池
    《计算机应用》唯一官方网站    2020, 40 (2): 347-351.   DOI: 10.11772/j.issn.1001-9081.2019081366
    摘要761)   HTML6)    PDF (722KB)(548)    收藏

    Ceph系统性能受Ceph配置参数的显著影响,在Ceph集群的配置优化中,配置参数种类繁多、含义复杂,导致难以实现快速准确寻优。针对以上问题,提出一种基于随机森林(RF)和遗传算法(GA)的参数调优方法,用于自动调整Ceph参数配置以优化Ceph系统性能。该方法使用RF算法为Ceph系统构建性能预测模型,并将预测模型的输出作为GA的输入,通过GA对参数配置方案进行自动迭代优化。仿真结果表明,调优后的参数配置较默认的参数配置相比,使Ceph文件系统的读写性能提高了约1.4倍,并且寻优耗时远低于黑盒参数调优方法。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 基于线性分配的难负样本挖掘度量学习
    傅泰铭, 陈燕, 李陶深
    《计算机应用》唯一官方网站    2020, 40 (2): 352-357.   DOI: 10.11772/j.issn.1001-9081.2019081403
    摘要307)   HTML0)    PDF (2386KB)(260)    收藏

    科学家依靠鲸鱼尾巴的形状及其独特的标记来识别鲸鱼的种类,但靠人眼识别和手工标注的过程非常繁琐。而且鲸鱼尾巴照片数据集存在数据分布不均衡的特点,其中个别种类样本数量极少,甚至仅有一份;同时样本个体差异较小,并且包含未知类别,导致以图像分类的方式完成鲸鱼身份的自动标注存在困难。为解决度量学习在该任务下难以分类的问题,在孪生神经网络(SNN)的基础上,利用线性分配问题(LAP)算法进行难负样本挖掘训练过程从而动态地构筑训练批次。首先对训练样本提取图像特征向量,并计算特征向量的相似性度量;然后通过LAP为模型分配样本对,根据度量分数矩阵动态地构筑训练样本批次,针对性地训练困难样本对。在一个数据分布不平衡的鲸鱼尾巴图像数据集和CUB-200-2001数据集上得到的实验结果表明,所提算法在少数类学习和细粒度图像分类上能取得良好的效果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    9. 移动群智感知中面向用户区域的分布式多任务分配方法
    韩俊樱, 张振宇, 孔德仕
    《计算机应用》唯一官方网站    2020, 40 (2): 358-362.   DOI: 10.11772/j.issn.1001-9081.2019081402
    摘要436)   HTML3)    PDF (575KB)(438)    收藏

    多数群智感知(MCS)任务分配方法针对单个任务,难以适用于多任务实时并发的现实场景,而且往往需要实时获取用户位置,不利于保护参与者隐私。针对上述问题,提出了一种面向用户区域的分布式多任务分配方法Crowd-Cluster。该方法首先通过贪心启发算法将全局感知任务及用户区域进行分簇;其次,基于空间关联性采用Q-learning算法将并发任务组合构成任务路径;接着,构建符合玻尔兹曼分布的用户意愿模型对任务路径进行动态定价;最后,基于历史信誉记录贪心优选参与者实现任务分配。基于真实数据集mobility的实验结果表明,Crowd-Cluster能有效减少参与者总人数及用户总移动距离,并且在低人群密度场景下,还能降低感知资源不足对任务完成度的影响。

    图表 | 参考文献 | 相关文章 | 多维度评价
    10. 最小化具有无线携能通信的全双工中继系统发射功率和
    周叶宁, 李陶深, 曾敏, 肖楠
    《计算机应用》唯一官方网站    2020, 40 (2): 363-368.   DOI: 10.11772/j.issn.1001-9081.2019081477
    摘要524)   HTML1)    PDF (718KB)(252)    收藏

    考虑在无线网络中采用信息与能量同步传输来提高无线中继系统的性能,提出了基于无线射频网络中采用无线携能通信(SWIPT)技术的具有自能量回收的双向传输全双工中继系统。SWIPT应用在双向全双工中继系统中是一个新的尝试,其中能量受限的目的节点使用从中继和环路信道捕获的能量来发送反馈信息,并给出了全双工中继系统工作的逻辑结构和能量受限的目的节点的物理结构。然后,以最小化系统发射功率和作为优化目标来描述系统的性能,采用功率分配方案进行信息解码和能量捕获,应用半定规划、秩松弛和拉格朗日方法将原始非凸优化方程转化为可解凸优化问题并求解,且联合优化了中继发射功率、发射波束成形向量和功率分配比率。最后,实验仿真对比了所提的新系统与传统双向传输中继系统,结果验证了利用自能量回收不仅可以消除自干扰,而且可以显著优化系统发射功率和,且由于SWIPT技术与全双工中继系统的结合,使得所提出的系统比传统的双向传输系统具有更高的性能增益。

    图表 | 参考文献 | 相关文章 | 多维度评价
    11. 基于分布式神经网络的苹果价格预测方法
    刘斌, 何进荣, 李远成, 韩宏
    《计算机应用》唯一官方网站    2020, 40 (2): 369-374.   DOI: 10.11772/j.issn.1001-9081.2019081454
    摘要372)   HTML2)    PDF (672KB)(373)    收藏

    针对传统农产品价格预测模型在大数据场景下无法快速准确对苹果市场价格进行预测的问题,提出一种基于分布式神经网络的苹果价格预测方法。首先,研究影响苹果市场价格的相关因素,选取苹果历史价格、替代品历史价格、居民消费水平和原油价格四个特征作为神经网络模型的输入;然后,构建蕴含价格波动规律的分布式神经网络模型,实现对苹果市场价格的短期预测。实验结果显示,基于分布式神经网络的苹果市场价格短期预测模型具有较高的预测精度,平均相对误差仅为0.50%,满足苹果市场价格预测的要求。实验结果表明,分布式神经网络模型能够通过自学习特性揭示出苹果市场价格的波动规律和发展趋势,所提方法能为稳定苹果市场秩序和市场价格宏观调控提供科学依据,有助于降低价格波动带来的危害,帮助果农规避市场风险。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 基于卷积神经网络框架的回声隐藏检测方法
    王杰, 王让定, 严迪群, 林昱臻
    《计算机应用》唯一官方网站    2020, 40 (2): 375-380.   DOI: 10.11772/j.issn.1001-9081.2019081400
    摘要364)   HTML1)    PDF (713KB)(416)    收藏

    回声隐藏是一种以音频为载体的隐写技术,目前针对回声隐藏的隐写分析方法主要以倒谱系数作为手工特征进行分类。然而,这些传统方法普遍在回声幅度较低时检测性能不高。针对回声幅度较低的情况,提出一种基于卷积神经网络(CNN)的回声隐藏隐写分析方法。首先利用短时傅里叶变换(STFT)提取音频的幅度谱系数矩阵作为浅层特征,然后设计了一个卷积神经网络框架对浅层特征进行进一步的深度特征提取,网络框架中包含了四个卷积模块以及三层全连接层,最后分类结果以Softmax进行输出。在三种经典的回声隐藏算法上对提出的方法进行了隐写分析实验评估,实验结果表明,该方法在低回声幅度条件下的检测率分别为98.62%、98.53%和93.20%,与目前所提出的传统基于手工特征的方法和基于深度学习的方法相比,检测性能提升10%以上。

    图表 | 参考文献 | 相关文章 | 多维度评价
    13. 使用深度对抗子空间聚类实现高光谱波段选择
    曾梦, 宁彬, 蔡之华, 谷琼
    《计算机应用》唯一官方网站    2020, 40 (2): 381-385.   DOI: 10.11772/j.issn.1001-9081.2019081385
    摘要630)   HTML0)    PDF (714KB)(360)    收藏

    高光谱图像(HSI)由数百个波段组成,波段之间的相关性强且具有较高的冗余度,导致出现维度灾难并且分类的复杂性很高。为此,使用深度对抗子空间聚类(DASC)网络进行高光谱的波段选择,并引入拉普拉斯正则化使网络更优,在保证分类精度的前提下降低分类的复杂度。该网络通过在编码器和解码器中引入自表达层来模仿传统子空间聚类的“自表达”属性,充分运用光谱信息和非线性特征转换得到波段之间的相互关系,解决传统波段选择方法无法同时考虑光谱和空间信息的问题。同时,引入对抗学习来监督自编码器的样本表示和子空间聚类,使得子空间聚类具有更好的自表达性能。为了使网络性能更优,加入拉普拉斯正则化来考虑反映图像几何信息的局部流形结构。实验在两个公开的高光谱数据集上进行,所提出的方法和几种主流的波段选择方法进行对比的结果表明,DASC方法在分类精度上优于对比方法,其选出的波段子集可以满足应用需求。

    图表 | 参考文献 | 相关文章 | 多维度评价
    14. 多种任务调度混合的IB-LBM并行优化方法
    刘智翔, 刘慧超, 黄冬梅, 周丽萍, 苏诚
    《计算机应用》唯一官方网站    2020, 40 (2): 386-391.   DOI: 10.11772/j.issn.1001-9081.2019081401
    摘要456)   HTML3)    PDF (941KB)(303)    收藏

    在使用浸入边界-格子玻尔兹曼方法(IB-LBM)求解流场时,为了得出比较精确的结果,往往需要规模较大、较密集的流场网格,这就会造成模拟过程时间长的问题。为了提高模拟的效率,利用IB-LBM局部计算的特点,结合OpenMP中三种不同的任务调度方式,给出了IB-LBM的并行优化方法。在并行优化中混合使用三种任务调度方式,以弥补单一任务调度造成的负载不均衡问题;将IB-LBM进行结构化分解,测试每一结构部分的最优调度方式,根据实验结果选择最优的调度组合方式,而在不同线程数下,最优的组合方式是不同的。优化结果通过并行加速比来检验,可以得出:在线程数较少的情况下,加速比趋近于理想状态;在线程数较多的情况下,虽然线程开辟和销毁的额外时间消耗对性能的优化产生了影响,模型的并行性能仍有了很大的提升。流场的模拟结果显示,在进行并行优化后, IB-LBM对流固耦合问题模拟的准确性并没有受到影响。

    图表 | 参考文献 | 相关文章 | 多维度评价
    15. 圆片下料并行遗传算法的设计与实现
    曾志阳, 陈燕, 王珂
    《计算机应用》唯一官方网站    2020, 40 (2): 392-397.   DOI: 10.11772/j.issn.1001-9081.2019081397
    摘要319)   HTML0)    PDF (658KB)(243)    收藏

    针对制造行业中的圆片下料问题,为了在合理的计算时间内使材料的利用率尽可能高,提出并行遗传下料算法(PGBA),以下料方案的材料利用率作为优化目标函数,将下料方案作为个体,采用多线程的方式对多个子种群并行进行遗传操作。首先,在并行遗传算法的基础上设计特定的个体编码方式,采用启发式方法生成种群的个体,以提高算法的搜索能力和效率,避免早熟现象的发生;然后,采用性能较好的遗传算子进行自适应的遗传操作,搜索出一种近似最优的下料方案;最后,通过多种实验验证算法的有效性。结果表明,与启发式算法相比,PGBA的计算时间有所增加,但材料利用率得到了较大的提高,能有效提高企业的经济效益。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. Graphlet Degree Vector方法的优化与并行
    宋祥帅, 杨伏长, 谢江, 张武
    《计算机应用》唯一官方网站    2020, 40 (2): 398-403.   DOI: 10.11772/j.issn.1001-9081.2019081387
    摘要545)   HTML0)    PDF (742KB)(287)    收藏

    Graphlet Degree Vector (GDV)是一种研究生物网络的重要方法,能揭示生物网络中各节点与其局部网络结构的相关性,但随着需要挖掘的自同构轨道数量的增加以及生物网络规模的增大,GDV方法的时间复杂度会呈指数级增长。针对这个问题,在现有串行GDV方法的基础上,实现了基于消息传递接口(MPI)的GDV方法并行化;此外又将GDV方法进行了改进并将改进后的方法实现了并行优化,改进后的方法在寻找不同节点自同构轨道的过程中优化了计算过程以解决重复计算的问题,同时结合负载均衡策略合理分配任务。模拟网络数据和真实生物网络数据上的实验结果表明,并行化的GDV方法与改进后的并行化GDV方法都具有较好的并行性能,并且对不同类型不同规模的网络都具有较强的适用性,扩展性强,可有效地保持寻找网络中自同构轨道的高效率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    17. 基于格子Boltzmann方法和大涡模拟的颈动脉分叉狭窄流动并行计算
    张毅卓, 葛森, 王良军, 谢江, 曹洁, 张武
    《计算机应用》唯一官方网站    2020, 40 (2): 404-409.   DOI: 10.11772/j.issn.1001-9081.2019081388
    摘要332)   HTML1)    PDF (1296KB)(364)    收藏

    颈动脉斑块的形成与复杂的血流动力学因素密切相关,血液流动状况的精确模拟对颈动脉斑块的临床诊断具有重要意义。为了精确模拟脉动流场,在格子Boltzmann方法(LBM)的基础上,添加大涡模拟(LES)模型,建立了LBM-LES颈动脉模拟算法。利用医学图像重构软件,建立颈动脉狭窄真实几何模型,对颈动脉狭窄脉动流动进行了数值模拟,通过计算血液流动速度、壁面剪切应力(WSS)等,得出了有意义的流动结果,验证了LBM-LES对颈动脉狭窄后段血液流动研究的有效性。基于OpenMP编程环境,在高性能集群机全互联胖节点上进行了千万量级网格的并行计算,结果表明LBM-LES颈动脉模拟算法具有较好的并行性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
2024年 44卷 4期
刊出日期: 2024-04-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会