推荐文章

    Please wait a minute...
    选择: 显示/隐藏图片
    1. 分布式机器学习作业性能干扰分析与预测
    李洪亮, 张弄, 孙婷, 李想
    《计算机应用》唯一官方网站    2022, 42 (6): 1649-1655.   DOI: 10.11772/j.issn.1001-9081.2021061404
    摘要41)   HTML4)    PDF (1121KB)(59)    收藏

    通过分析分布式机器学习中作业性能干扰的问题,发现性能干扰是由于内存过载、带宽竞争等GPU资源分配不均导致的,为此设计并实现了快速预测作业间性能干扰的机制,该预测机制能够根据给定的GPU参数和作业类型自适应地预测作业干扰程度。首先,通过实验获取分布式机器学习作业运行时的GPU参数和干扰率,并分析出各类参数对性能干扰的影响;其次,依托多种预测技术建立GPU参数-干扰率模型进行作业干扰率误差分析;最后,建立自适应的作业干扰率预测算法,面向给定的设备环境和作业集合自动选择误差最小的预测模型,快速、准确地预测作业干扰率。选取5种常用的神经网络作业,在两种GPU设备上设计实验并进行结果分析。结果显示,所提出的自适应干扰预测(AIP)机制能够在不提供任何预先假设信息的前提下快速完成预测模型的选择和性能干扰预测,耗时在300 s以内,预测干扰率误差在2%~13%,可应用于作业调度和负载均衡等场景。

    图表 | 参考文献 | 相关文章 | 多维度评价
    2. 基于交叉层级数据共享的多任务模型
    陈颖, 于炯, 陈嘉颖, 杜旭升
    《计算机应用》唯一官方网站    2022, 42 (5): 1447-1454.   DOI: 10.11772/j.issn.1001-9081.2021030516
    摘要18)   HTML3)    PDF (1841KB)(14)    收藏

    针对多任务学习模型中相关度低的任务之间存在的负迁移现象和信息共享困难问题,提出了一种基于交叉层级数据共享的多任务模型。该模型关注细粒度的知识共享,且能保留浅层共享专家的记忆能力和深层特定任务专家的泛化能力。首先,统一多层级共享专家,以获取复杂相关任务间的公共知识;然后,将共享信息分别迁移到不同层级的特定任务专家之中,从而在上下层之间共享部分公共知识;最后,利用基于数据样本的门控网络自主选择不同任务所需信息,从而减轻样本依赖性对模型的不利影响。相较于多门控混合专家(MMOE)模型,所提模型在UCI census-income数据集上对两个任务的F1值分别提高了7.87个百分点和1.19个百分点;且在MovieLens数据集上的回归任务的均方误差(MSE)值降低到0.004 7,分类任务的AUC值提高到0.642。实验结果表明,所提出的模型适用于改善负迁移现象的影响,且能更高效地学习复杂相关任务之间的公共信息。

    图表 | 参考文献 | 相关文章 | 多维度评价
    3. 基于代码图像合成的Android恶意软件家族分类方法
    李默, 芦天亮, 谢子恒
    《计算机应用》唯一官方网站    2022, 42 (5): 1490-1499.   DOI: 10.11772/j.issn.1001-9081.2021030486
    摘要15)   HTML0)    PDF (3025KB)(12)    收藏

    代码图像化技术被提出后在Android恶意软件研究领域迅速普及。针对使用单个DEX文件转换而成的代码图像表征能力不足的问题,提出了一种基于代码图像合成的Android恶意软件家族分类方法。首先,将安装包中的DEX、XML与反编译生成的JAR文件进行灰度图像化处理,并使用Bilinear插值算法来放缩处理不同尺寸的灰度图像,然后将三张灰度图合成为一张三维RGB图像用于训练与分类。在分类模型上,将软阈值去噪模块与基于Split-Attention的ResNeSt相结合提出了STResNeSt。该模型具备较强的抗噪能力,更能关注代码图像的重要特征。针对训练过程中的数据长尾分布问题,在数据增强的基础上引入了类别平衡损失函数(CB Loss),从而为样本不平衡造成的过拟合现象提供了解决方案。在Drebin数据集上,合成代码图像的准确率领先DEX灰度图像2.93个百分点,STResNeSt与残差神经网络(ResNet)相比准确率提升了1.1个百分点,且数据增强结合CB Loss的方案将F1值最高提升了2.4个百分点。实验结果表明,所提方法的平均分类准确率达到了98.97%,能有效分类Android恶意软件家族。

    图表 | 参考文献 | 相关文章 | 多维度评价
    4. 支持中文医疗问答的基于注意力机制的栈卷积神经网络模型
    滕腾, 潘海为, 张可佳, 牟雪莲, 张锡明, 陈伟鹏
    《计算机应用》唯一官方网站    2022, 42 (4): 1125-1130.   DOI: 10.11772/j.issn.1001-9081.2021071272
    摘要116)   HTML23)    PDF (726KB)(60)    收藏

    当前的中文问答匹配技术大多都需要先进行分词,中文医疗文本的分词问题需要维护医学词典来缓解分词错误对后续任务影响,而维护词典需要大量人力和知识,致使分词问题一直具有极大的挑战性。同时,现有的中文医疗问答匹配方法都是对问题和答案分开建模,并未考虑问题和答案中各自包含的关键词汇间的关联关系。因此,提出了一种基于注意力机制的栈卷积神经网络(Att-StackCNN)模型来解决中文医疗问答匹配问题。首先,使用字嵌入对问题和答案进行编码以得到二者各自的字嵌入矩阵;然后,通过利用问题和答案的字嵌入矩阵构造注意力矩阵来得到二者各自的特征注意力映射矩阵;接着,利用栈卷积神经网络(Stack-CNN)模型同时对上述矩阵进行卷积操作,从而得到问题和答案各自的语义表示;最后,进行相似度计算,并利用相似度计算最大边际损失以更新网络参数。所提模型在cMedQA数据集上的Top-1正确率比Stack-CNN模型高接近1个百分点,比Multi-CNNs模型高接近0.5个百分点。实验结果表明,Att-StackCNN模型可以提升中文医疗问答匹配效果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    5. 知识图谱增强的科普文本分类模型
    唐望径, 许斌, 仝美涵, 韩美奂, 王黎明, 钟琦
    《计算机应用》唯一官方网站    2022, 42 (4): 1072-1078.   DOI: 10.11772/j.issn.1001-9081.2021071278
    摘要142)   HTML14)    PDF (1056KB)(81)    收藏

    科普文本分类是将科普文章按照科普分类体系进行划分的任务。针对科普文章篇幅超过千字,模型难以聚焦关键信息,造成传统模型分类性能不佳的问题,提出一种结合知识图谱进行两级筛选的科普长文本分类模型,来减少主题无关信息的干扰,提升模型的分类性能。首先,采用四步法构建科普领域的知识图谱;然后,将该知识图谱作为距离监督器,并通过训练句子过滤器来过滤掉无关信息;最后,使用注意力机制对过滤后的句子集做进一步的信息筛选,并实现基于注意力的主题分类模型。在所构建的科普文本分类数据集(PSCD)上的实验结果表明,基于领域知识图谱的知识增强的文本分类算法模型具有更高的F1-Score,相较于TextCNN模型和BERT模型,在F1-Score上分别提升了2.88个百分点和1.88个百分点,验证了知识图谱对于长文本信息筛选的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 基于神经网络架构搜索的肺结节分类算法
    谢新林, 肖毅, 续欣莹
    《计算机应用》唯一官方网站    2022, 42 (5): 1424-1430.   DOI: 10.11772/j.issn.1001-9081.2021050813
    摘要93)   HTML1)    PDF (1632KB)(25)    收藏

    肺结节分类是早期肺癌诊断的重要任务。基于深度学习的肺结节分类方法虽然能够取得良好的分类精度,但存在模型复杂和可解释性差的问题。为此,提出了一种基于神经网络架构搜索的肺结节分类算法。首先,将注意力残差卷积cell作为搜索空间的基本单元,并使用偏序剪枝方法作为搜索策略来构建神经网络架构以搜索3D分类网络,从而达到网络性能和搜索速度的平衡。其次,在网络中构建了多尺度通道和空间注意力模块来提高特征描述和类别推理的可解释性。最后,采用堆叠法将搜索到的网络架构进行多模型的融合,从而获取精准的肺结节良恶性分类预测结果。实验结果表明,在肺结节分类常用数据集LIDC-IDRI上,所提算法与最新肺结节分类算法相比具有较好的分类性能和较快的收敛,且所提算法的特异性和精确率分别达到95.37%和93.42%,能够实现良恶性肺结节的准确分类。

    图表 | 参考文献 | 相关文章 | 多维度评价
    7. 基于图像秘密共享的密文域可逆信息隐藏算法
    王泽曦, 张敏情, 柯彦, 孔咏骏
    《计算机应用》唯一官方网站    2022, 42 (5): 1480-1489.   DOI: 10.11772/j.issn.1001-9081.2021050823
    摘要52)   HTML0)    PDF (4022KB)(15)    收藏

    针对当前密文域可逆信息隐藏算法嵌入秘密信息后的携密密文图像的容错性与抗灾性不强,一旦遭受攻击或损坏就无法重构原始图像与提取秘密信息的问题,提出了一种基于图像秘密共享的密文域可逆信息隐藏算法,并分析了该算法在云环境下的应用场景。首先,将加密图像分割成大小相同的n份不同携密密文图像。然后,在分割的过程中将拉格朗日插值多项式中的随机量作为冗余信息,并建立秘密信息与多项式各项系数间的映射关系。最后,通过修改加密过程的内置参数,实现秘密信息的可逆嵌入。当收集k份携密密文图像时,可无损地恢复原始图像与提取秘密信息。实验结果表明,所提算法具有计算复杂度低、嵌入容量大和完全可逆等特点。在(3,4)门限方案中,所提算法的最大嵌入率可达4 bpp;在(4,4)门限方案中,其最大嵌入率可达6 bpp。所提算法充分发挥了秘密共享方案的容灾特性,在不降低秘密共享安全性的基础上,增强了携密密文图像的容错性与抗灾性,提高了算法的嵌入容量与云环境应用场景下的容灾能力,保证了载体图像与秘密信息的安全。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 求解工程约束问题的新型智能优化算法及展望
    张孟健, 王德光, 汪敏, 杨靖
    《计算机应用》唯一官方网站    2022, 42 (2): 534-541.   DOI: 10.11772/j.issn.1001-9081.2021020265
    摘要190)   HTML27)    PDF (849KB)(201)    收藏

    为了研究新型智能优化算法的性能和应用前景,选择了近几年提出的6种仿生智能优化算法:哈里斯鹰优化(HHO)算法、平衡优化(EO)算法、海洋捕食者算法(MPA)、政治优化(PO)算法、黏液霉菌算法(SMA)和堆阵优化(HBO)算法,对其性能和在不同带约束的工程优化问题上的应用进行对比分析。首先,对6种优化算法的基本原理进行介绍;然后,用6种优化算法对10个基准测试函数进行寻优测试;接着,将6种优化算法用于求解3种带约束的工程优化问题。实验结果表明,对于单峰和多峰测试函数的寻优,PO的收敛精度最佳,能够多次达到理论最优值0,且收敛速度较快;对于求解工程约束问题,EO和MPA较好,因为的标准差的数量级较小,且寻优速度较快,稳定性高。最后,分析了6种优化算法的改进方法及其发展潜力。

    图表 | 参考文献 | 相关文章 | 多维度评价
    9. 联邦学习通信开销研究综述
    邱鑫源, 叶泽聪, 崔翛龙, 高志强
    《计算机应用》唯一官方网站    2022, 42 (2): 333-342.   DOI: 10.11772/j.issn.1001-9081.2021020232
    摘要710)   HTML138)    PDF (1356KB)(1471)    收藏

    为了解决数据共享需求与隐私保护要求之间不可调和的矛盾,联邦学习应运而生。联邦学习作为一种分布式机器学习,其中的参与方与中央服务器之间需要不断交换大量模型参数,而这造成了较大通信开销;同时,联邦学习越来越多地部署在通信带宽有限、电量有限的移动设备上,而有限的网络带宽和激增的客户端数量会使通信瓶颈加剧。针对联邦学习的通信瓶颈问题,首先分析联邦学习的基本工作流程;然后从方法论的角度出发,详细介绍基于降低模型更新频率、模型压缩、客户端选择的三类主流方法和模型划分等特殊方法,并对具体优化方案进行深入的对比分析;最后,对联邦学习通信开销技术研究的发展趋势进行了总结和展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    10. 面向航空自组网的节点失效波及影响分析模型
    谢丽霞, 严莉萍, 杨宏宇
    《计算机应用》唯一官方网站    2022, 42 (2): 493-501.   DOI: 10.11772/j.issn.1001-9081.2021020348
    摘要100)   HTML8)    PDF (1030KB)(95)    收藏

    为有效分析航空自组网(AANET)中节点失效对整个网络造成的影响,并提高网络在发生安全事件之后的稳定性,提出一种面向AANET的节点失效波及影响分析模型。首先,根据AANET的主要业务建立有向加权业务网络,基于实时AANET建立以各类航空器为节点的无向加权物理网络,并通过业务-物理网络映射关系建立相依网络模型;其次,提出面向AANET的失效传播模型,分析网络节点状态及其之间的相互转换方式;最后,基于链路生存性改进失效流量再分配算法,并将其应用于构建的相依网络模型上,得到因节点失效波及反应转化成失效节点和业务降级节点的集合,并将其用于分析网络各时刻的波及影响情况。实验结果表明,所提出的模型能更准确反映AANET节点失效波及影响情况。

    图表 | 参考文献 | 相关文章 | 多维度评价
    11. 基于星火区块链的跨链机制
    谢家贵, 李志平, 金键
    《计算机应用》唯一官方网站    2022, 42 (2): 519-527.   DOI: 10.11772/j.issn.1001-9081.2021020353
    摘要215)   HTML27)    PDF (888KB)(346)    收藏

    针对当前区块链技术飞速发展的过程中,不同区块链之间相对孤立,数据不能交互共享的问题,提出一种基于星火区块链的跨链机制。首先,对常见跨链技术和当前主流跨链项目作了分析,研究了不同技术和项目的实现原理,并总结了它们的区别和优缺点;然后,利用主子链模式的区块链架构,设计了智能合约组件、交易校验组件、交易超时组件等关键核心组件,并详细阐述了跨链过程的交易发起、交易路由、交易核验、交易确认这四个阶段;最后,设计了可行的实验进行性能测试和安全性测试,并对安全性进行了分析。实验结果表明,星火区块链在交易延迟、吞吐量和尖峰冲击测试等方面相比其他区块链有较显著的优势;另外在恶意节点的比例较低时,跨链交易的成功率为100%,不同子链间可以安全稳定地进行跨链交易。该机制解决了区块链之间数据交互共享的问题,能为下一步星火区块链应用场景的设计提供技术参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 基于多模态深度融合的虚假信息检测
    孟杰, 王莉, 杨延杰, 廉飚
    《计算机应用》唯一官方网站    2022, 42 (2): 419-425.   DOI: 10.11772/j.issn.1001-9081.2021071184
    摘要188)   HTML28)    PDF (1079KB)(132)    收藏

    针对虚假信息检测中图片特征提取不充分,以及忽视了单模内关系以及单模与多模之间交互作用的问题,提出一种基于文本和图片信息的多模态深度融合(MMDF)模型。首先,用双向门控循环单元(Bi-GRU)提取文本的丰富语义特征,用多分支卷积-循环神经网络(CNN-RNN)提取图片的多层次特征;然后,建立模间和模内的注意力机制以捕获语言和视觉领域之间的高层交互,并得到多模态的联合表征;最后,将各模态原表征与融合后的多模态联合表征依据注意力权重进行再融合,以加强原信息的作用。该模型与多模态变分自动编码器(MVAE)模型相比,在中国计算机学会(CCF)竞赛和微博数据集上的准确率分别提升了1.9个百分点和2.4个百分点。实验结果表明,所提模型能够充分融合多模态信息,有效提高虚假信息检测的准确率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    13. 基于卷积神经网络交互的用户属性偏好建模的推荐模型
    潘仁志, 钱付兰, 赵姝, 张燕平
    《计算机应用》唯一官方网站    2022, 42 (2): 404-411.   DOI: 10.11772/j.issn.1001-9081.2021041070
    摘要173)   HTML25)    PDF (633KB)(147)    收藏

    潜在因子模型(LFM)以其优异的性能在推荐领域得到了广泛应用。在LFM中除了使用交互数据以外,辅助信息也被引入用于解决数据稀疏的问题,从而提升推荐的性能。然而,大多数LFM仍然存在一些问题:第一,LFM在对用户进行建模时,忽略了用户如何根据其特征偏好对项目作出决策;第二,采用内积的特征交互假设特征维度之间是相互独立的,而没有考虑到特征维度之间的关联。针对上述问题,提出一种新的推荐模型:基于卷积神经网络(CNN)交互的用户属性偏好建模的推荐模型(UAMC)。该模型首先获得用户的一般偏好、用户属性和项目嵌入,然后将用户属性和项目嵌入进行交互,以探索用户不同的属性对不同项目的偏好;接着将交互过的用户偏好属性送入CNN层来探索不同偏好属性的不同维度的关联,从而得到用户的属性偏好向量;接着使用注意力机制结合用户的一般偏好和CNN层得到的属性偏好,从而获得用户的向量表示;最后采用点积来计算用户对项目的评分。在Movielens-100K、Movielens-1M和Book-crossing这三个真实的数据集上进行了实验。实验结果表明,所提模型在均方根误差(RMSE)上与稀疏数据预测的神经网络分解机(NFM)模型相比分别降低了1.75%、2.78%和0.25%,验证了在LFM的评分预测推荐中,UAMC在提升推荐精度上的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    14. 注入注意力机制的深度特征融合新闻推荐模型
    刘羽茜, 刘玉奇, 张宗霖, 卫志华, 苗冉
    《计算机应用》唯一官方网站    2022, 42 (2): 426-432.   DOI: 10.11772/j.issn.1001-9081.2021050907
    摘要223)   HTML34)    PDF (755KB)(156)    收藏

    现有新闻推荐模型在挖掘新闻特征和用户特征时,往往没有考虑所浏览新闻之间的关系、时序变化以及不同新闻对用户的重要性,从而缺乏全面性;同时,现有模型在新闻更细粒度的内容特征挖掘方面有欠缺。因此构建了一个能够全面而不冗余地进行用户表征并能提取新闻更细粒度片段特征的新闻推荐模型——注入注意力机制的深度特征融合新闻推荐模型。该模型首先采用基于深度学习的方法,通过注入注意力机制的卷积神经网络(CNN)对新闻文本特征矩阵进行深度提取;然后,通过对用户已经浏览的新闻添加时序预测,并注入多头自注意力机制,来提取用户的兴趣特征;最后,使用真实的中文数据集与英文数据集,以收敛时间、平均值倒数秩(MRR)和归一化折现累积收益(nDCG)为指标进行实验。与基于多头自注意力的神经网络新闻推荐(NRMS)模型等进行对比,该模型在中文数据集上nDCG的提升率为-0.22%~4.91%,MRR的提升率为-0.82%~3.48%,而且,与唯一为负提升率的模型相比,收敛时间缩短7.63%;在英文数据集上该模型在nDCG和MRR上的提升率分别为0.07%~1.75%与0.03%~1.30%,且该模型始终具有较快的收敛速度。消融实验的结果表明增加注意力机制与时序模块是有效的。

    图表 | 参考文献 | 相关文章 | 多维度评价
    15. 基于深度Q网络的多目标任务卸载算法
    邓世权, 叶绪国
    《计算机应用》唯一官方网站    2022, 42 (6): 1668-1674.   DOI: 10.11772/j.issn.1001-9081.2021061367
    摘要54)   HTML0)    PDF (1781KB)(38)    收藏

    在移动边缘计算(MEC)中,计算资源和电池容量有限的移动设备(MD)可卸载自身计算密集型应用到边缘服务器上执行,这样不仅可以提高MD计算能力,也能降低能耗。然而,不合理的任务卸载决策不但会延长应用完成时间,而且会大量增加能耗,进而降低用户体验。鉴于此,首先分析MD的移动性和任务间的顺序依赖关系,建立动态MEC网络下的以应用完成时间和能源消耗最小为优化目标的多目标任务卸载问题模型;然后,设计求解该问题的马尔可夫决策过程(MDP)模型,包括状态空间、动作空间和奖励函数,并提出基于深度Q网络(DQN)的多目标任务卸载算法(MTOA-DQN),该算法采用一条轨迹作为经验池的最小单元来改进原始的DQN算法。在多种测试场景下,MTOA-DQN的性能在累积奖励和Cost方面均优于三种对比算法(基于分解的多目标进化算法(MOEA/D)、自适应的DAG任务调度算法(ADTS)和原始的DQN算法),验证了该算法的有效性和可靠性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. 移动边缘计算中资源受限的动态服务部署策略
    袁景凌, 毛慧华, 王娜娜, 向尧
    《计算机应用》唯一官方网站    2022, 42 (6): 1662-1667.   DOI: 10.11772/j.issn.1001-9081.2021061615
    摘要37)   HTML1)    PDF (1940KB)(13)    收藏

    移动边缘计算(MEC)的出现使移动用户能够以低延迟访问部署在边缘服务器上的服务。然而,MEC仍然存在各种挑战,尤其是服务部署问题。边缘服务器的数量和资源通常是有限的,只能部署数量有限的服务;此外,用户的移动性改变了不同服务在不同地区的流行度。在这种情况下,为动态请求部署合适的服务就成为一个关键问题。针对该问题,通过了解动态用户请求来部署适当的服务以最小化交互延迟,将服务部署问题表述为一个全局优化问题,并提出了一种基于集群划分的资源聚合算法,从而在计算、带宽等资源约束下初步部署合适的服务。此外,考虑动态用户请求对服务流行度及边缘服务器负载的影响,开发了动态调整算法来更新现有服务,以确保服务质量(QoS)始终满足用户期望。通过一系列仿真实验验证了所提出策略的性能。仿真结果表明,与现有基准算法相比,所提出的策略可以降低服务交互延迟并实现更稳定的负载均衡。

    图表 | 参考文献 | 相关文章 | 多维度评价
    17. 新型算力网络架构及其应用案例分析
    狄筝, 曹一凡, 仇超, 罗韬, 王晓飞
    《计算机应用》唯一官方网站    2022, 42 (6): 1656-1661.   DOI: 10.11772/j.issn.1001-9081.2021061497
    摘要72)   HTML2)    PDF (1584KB)(19)    收藏

    随着人工智能(AI)算力向网络边缘甚至终端设备扩散,端边云超协同的算力网络成为最佳计算解决方案,而新机遇催生了端边云超计算和网络之间的深度集成。然而,集成系统的完整开发还没有得到很好的解决,包括适应性、灵活性和价值性,因此提出了一种区块链赋能的端边云超算力网络架构。其中,端边云超融合为框架提供基础设施,该设施构成的算力资源池为用户提供安全可靠的算力,网络通过调度资源满足用户需求,而框架内的神经网络和执行平台为AI任务执行提供接口;同时,区块链保证资源交易的可靠性,以激励更多算力贡献者加入平台。本框架为算力网络中的用户提供了适应性,为组网算力资源调度提供了灵活性,为算力供应商提供了价值激励,并利用案例清晰地描述了该新型算力网络架构。

    图表 | 参考文献 | 相关文章 | 多维度评价
    18. 基于先验知识的非负矩阵半可解释三因子分解算法
    陈露, 张晓霞, 于洪
    《计算机应用》唯一官方网站    2022, 42 (3): 671-675.   DOI: 10.11772/j.issn.1001-9081.2021040927
    摘要175)   HTML16)    PDF (600KB)(132)    收藏

    非负矩阵三因子分解是潜在因子模型中的重要组成部分,由于能将原始数据矩阵分解为三个相互约束的潜因子矩阵,被广泛应用于推荐系统、迁移学习等研究领域,但目前还没有非负矩阵三因子分解的可解释性方面的研究工作。鉴于此,将用户评论文本信息当作先验知识,设计了一种基于先验知识的非负矩阵半可解释三因子分解(PE-NMTF)算法。首先利用情感分析技术提取用户评论文本信息的情感极性偏好;然后更改了非负矩阵三因子分解算法的目标函数和更新公式,巧妙地将先验知识嵌入到算法中;最后在推荐系统冷启动任务的Yelp和Amazon数据集以及图像零次识别任务的AwA和CUB数据集上与非负矩阵分解、非负矩阵三因子分解算法做了大量对比实验,实验结果表明所提算法在均方根误差(RMSE)、归一化折损累计增益(NDCG)、归一化互信息(NMI)和准确率(ACC)上都表现优异,且利用先验知识进行非负矩阵三因子分解的解释具有可行性和有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    19. 融合多粒度社区信息的网络嵌入方法
    胡军, 许正康, 刘立, 钟福金
    《计算机应用》唯一官方网站    2022, 42 (3): 663-670.   DOI: 10.11772/j.issn.1001-9081.2021040790
    摘要231)   HTML53)    PDF (758KB)(228)    收藏

    现有大多数网络嵌入方法仅保留了网络的局部结构信息,而忽略了网络中的其他潜在信息。为了保留网络的社区信息,并体现网络社区结构的多粒度特性,提出一种融合多粒度社区信息的网络嵌入方法(EMGC)。首先,获得网络的多粒度社区结构,并初始化节点嵌入和社区嵌入;然后,根据上一粒度上的节点嵌入和本层粒度的社区结构,更新社区嵌入,进而调整相应的节点嵌入;最后,对不同粒度下的节点嵌入进行拼接,从而得到融合多粒度社区信息的网络嵌入结果。在4个真实网络数据集上进行实验,相较于未考虑社区信息的方法(DeepWalk、node2vec)和考虑了单一粒度社区信息的方法(ComE、GEMSEC),EMGC在链接预测上的AUC值和节点分类上的F1值总体上优于对比方法。实验结果表明EMGC能够有效提升后续链接预测和节点分类的准确率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    20. 基于随机素描方法的在线核回归
    刘清华, 廖士中
    《计算机应用》唯一官方网站    2022, 42 (3): 676-682.   DOI: 10.11772/j.issn.1001-9081.2021040869
    摘要92)   HTML15)    PDF (628KB)(64)    收藏

    在线核回归学习中,每当一个新的样本到来,训练器都需要计算核矩阵的逆矩阵,这个过程的计算复杂度至少为关于回合数的平方级别。提出将素描方法应用于假设的更新,给出一个基于素描方法的更高效的在线核回归算法。首先,将损失函数设定为平方损失,应用Nystr?m近似方法来近似核,并借鉴跟导方法(FTL)的思想,提出一个新的梯度下降算法,称之为FTL-在线核回归(F-OKR);然后,应用素描方法对其加速,使得F-OKR的计算复杂度降低到关于回合数和素描规模线性、关于数据维度平方的级别;最后,设计了一个高效的素描在线核回归算法(SOKR)。与F-OKR相比,SOKR的精度几乎没有影响,而同时在适当的数据集上,运行时间减少16.7%左右。在理论上证得了两种算法的亚线性后悔界。实验结果也验证了所提算法与Nystr?m在线梯度下降算法(NOGD)相比有更好的表现,平均损失降低约64%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    21. 基于节点相似度的无监督属性图嵌入模型
    李扬, 吴安彪, 袁野, 赵琳琳, 王国仁
    《计算机应用》唯一官方网站    2022, 42 (1): 1-8.   DOI: 10.11772/j.issn.1001-9081.2021071221
    摘要379)   HTML101)    PDF (864KB)(400)    收藏

    属性图嵌入旨在将属性图中的节点表示为低维向量,并同时保留节点的拓扑信息和属性信息。属性图嵌入已经有一系列相关工作,然而它们大多数提出的是有监督或半监督的算法。在实际应用中,需要标记的节点数量多,导致这些属性图嵌入算法的难度大,且需要消耗巨大的人力物力。针对上述问题以无监督的视角重新分析,提出了一种无监督的属性图嵌入算法。首先,通过已存在的无属性图嵌入算法和属性图的属性分别计算节点的拓扑信息和属性信息;其次,利用图卷积网络(GCN)得到节点的嵌入向量,并使得嵌入向量与拓扑信息以及嵌入向量与属性信息的差最小;最终,使拓扑信息和属性信息都相似的成对节点得到相似嵌入。与图自动编码器(GAE)方法相比,所提出的方法在Cora、Citeseer数据集上的节点分类准确率分别提升了1.2个百分点和2.4个百分点。实验结果表明,所提出的方法能够有效提高生成的嵌入的质量。

    图表 | 参考文献 | 相关文章 | 多维度评价
    22. 二进制代码相似性搜索研究进展
    夏冰, 庞建民, 周鑫, 单征
    《计算机应用》唯一官方网站    2022, 42 (4): 985-998.   DOI: 10.11772/j.issn.1001-9081.2021071267
    摘要370)   HTML92)    PDF (841KB)(389)    收藏

    随着物联网和工业互联网的快速发展,网络空间安全的研究日益受到工业界和学术界的重视。由于源代码无法获取,二进制代码相似性搜索成为漏洞挖掘和恶意代码分析的关键核心技术。首先,从二进制代码相似性搜索基本概念出发,给出二进制代码相似性搜索系统框架;然后,围绕相似性技术系统介绍二进制代码语法相似性搜索、语义相似性搜索和语用相似性搜索的发展现状;其次,从二进制哈希、指令序列、图结构、基本块语义、特征学习、调试信息恢复和函数高级语义识别等角度总结比较现有解决方案;最后,展望二进制代码相似性搜索未来发展方向与前景。

    图表 | 参考文献 | 相关文章 | 多维度评价
    23. 解耦表征学习研究进展
    成科扬, 孟春运, 王文杉, 师文喜, 詹永照
    《计算机应用》唯一官方网站    2021, 41 (12): 3409-3418.   DOI: 10.11772/j.issn.1001-9081.2021060895
    摘要337)   HTML42)    PDF (877KB)(219)    收藏

    解耦表征学习旨在对影响数据形态的关键因素进行建模,使得某一关键因素的变化仅仅引起数据在某项特征上的变化,而其他的特征不受影响,这有利于应对机器学习在模型可解释性、对象生成和操作以及零样本学习等问题上的挑战,因此解耦表征学习一直是机器学习领域的一个研究热点。从解耦表征学习的历史与动机入手,对解耦表征学习的研究现状以及应用进行归纳总结,分析了解耦表征所具有的不变性、复用性等特性,介绍了基于生成解耦表征变差因素的研究、基于流形相互作用解耦表征变差因素的研究、基于对抗性训练解耦表征变差因素的研究,以及一种变分自编码器β-VAE的研究等最新研究动态。同时,阐述了解耦表征学习的典型应用,并对未来的研究方向作出了展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    24. 动态数据上的高效用模式挖掘综述
    单芝慧, 韩萌, 韩强
    《计算机应用》唯一官方网站    2022, 42 (1): 94-108.   DOI: 10.11772/j.issn.1001-9081.2021071290
    摘要113)   HTML13)    PDF (1668KB)(104)    收藏

    高效用模式挖掘(HUPM)考虑了项的购买数量及单位利润,提供了项更详细的信息,使用户能够做出更好的经济决策。针对大多数HUPM算法都应用在与不断产生数据的现实世界不符的静态数据集上的问题,近些年不断提出了动态数据上的HUPM算法。首先,对增量数据、数据流、动态删除和动态修改数据上的HUPM算法以及融合高效用模式(高效用序列模式、平均高效用模式、top-k高效用模式等)挖掘算法进行了总结;然后,对使用不同类型数据的算法进行了总结,包括动态利润数据、动态序列数据等数据类型;其次,从算法使用的数据结构、剪枝策略、窗口模型、优缺点等角度对HUPM算法进行分类总结;最后,针对目前研究的不足,提出了下一步动态数据上的HUPM算法研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    25. 知识图谱综述——表示、构建、推理与知识超图理论
    田玲, 张谨川, 张晋豪, 周望涛, 周雪
    《计算机应用》唯一官方网站    2021, 41 (8): 2161-2186.   DOI: 10.11772/j.issn.1001-9081.2021040662
    摘要795)      PDF (2811KB)(2088)    收藏
    针对知识图谱(KG)在知识驱动的人工智能研究中发挥的强大支撑作用,分析并总结了现有知识图谱和知识超图技术。首先,从知识图谱的定义与发展历程出发,介绍了知识图谱的分类和架构;其次,对现有的知识表示与存储方式进行了阐述;然后,基于知识图谱的构建流程,分析了各类知识图谱构建技术的研究现状。特别是针对知识图谱中的知识推理这一重要环节,分析了基于逻辑规则、嵌入表示和神经网络的三类典型的知识推理方法。此外,以异构超图引出知识超图的研究进展,并提出三层架构的知识超图,从而更好地表示和提取超关系特征,实现对超关系数据的建模及快速的知识推理。最后,总结了知识图谱和知识超图的典型应用场景并对未来的研究作出了展望。
    参考文献 | 相关文章 | 多维度评价
    26. 基于层级多任务BERT的海关报关商品分类算法
    阮启铭, 过弋, 郑楠, 王业相
    《计算机应用》唯一官方网站    2022, 42 (1): 71-77.   DOI: 10.11772/j.issn.1001-9081.2021010122
    摘要162)   HTML18)    PDF (697KB)(82)    收藏

    海关商品申报场景下,需采用分类模型将商品归类为统一的海关(HS)编码。然而现有海关商品分类模型忽略了待分类文本中词语的位置信息,同时HS编码数以万计,会导致类别向量稀疏、模型收敛速度慢等问题。针对上述问题,结合真实业务场景下人工逐层归类策略,充分利用HS编码的层次结构特点,提出了一种基于层级多任务BERT(HM-BERT)的分类模型。一方面通过BERT模型的动态词向量获取了报关商品文本中的位置信息,另一方面利用HS编码不同层级的类别信息对BERT模型进行多任务训练,以提高归类的准确性和收敛性。在国内某报关服务商2019年的报关数据集上进行的所提模型的有效性验证,相比BERT模型,HM-BERT模型的准确率提高了2个百分点,在模型训练速度上也有所提升;与同样分层级的H-fastText相比,准确率提高了7.1个百分点。实验结果表明,HM-BERT模型能有效改善海关报关商品的分类效果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    27. 门罗币匿名及追踪技术综述
    林定康, 颜嘉麒, 巴楠登, 符朕皓, 姜皓晨
    《计算机应用》唯一官方网站    2022, 42 (1): 148-156.   DOI: 10.11772/j.issn.1001-9081.2021020296
    摘要390)   HTML24)    PDF (723KB)(317)    收藏

    虚拟数字货币为恐怖分子融资、洗钱、毒品交易等犯罪活动提供了温床,而门罗币作为新兴数字货币的代表,具有公认的高匿名性。针对利用门罗币匿名性犯罪的问题,从技术角度探索门罗币匿名技术及其追踪技术,综述近年来的研究进展,从而为有效应对基于区块链技术的犯罪提供技术支持。具体来说,总结了门罗币匿名技术的演进,并梳理了学术界关于门罗币匿名技术的追溯对策。首先,在匿名技术中,介绍了环签名、保证不可链接性(一次性公钥)、保证不可追溯性、提高匿名性的重要版本升级等。然后,在追踪技术中,介绍了0-mixin攻击、输出合并攻击、最新猜测攻击、封闭集攻击、泛洪攻击、恶意远程节点攻击、钱包环攻击等攻击方法。最后,基于对匿名技术和追溯对策的分析,得出了四点结论:门罗币的匿名技术和追踪技术的发展相互促进;RingCT的应用是一把双刃剑,既使得从币值出发的被动攻击方法失效,也使得主动攻击方法更加容易奏效;输出合并攻击和0-mixin攻击具有互补作用;门罗币的系统安全链条仍待理顺。

    图表 | 参考文献 | 相关文章 | 多维度评价
    28. 基于作者偏好的学术投稿刊物推荐算法
    董永峰, 屈向前, 李林昊, 董瑶
    《计算机应用》唯一官方网站    2022, 42 (1): 50-56.   DOI: 10.11772/j.issn.1001-9081.2021010185
    摘要187)   HTML27)    PDF (605KB)(175)    收藏

    针对投稿刊物推荐算法总是单独考虑文本主题或者作者历史发刊记录,导致投稿刊物推荐结果准确率低的问题,提出了一种基于作者偏好的学术刊物投稿推荐算法。该算法不仅协调使用了文本主题和作者历史发刊记录,还挖掘了投稿刊物的学术焦点与时间的潜在联系。首先,使用潜在狄利克雷(LDA)主题模型对文章标题进行主题提取;其次,建立主题-刊物和时间-刊物的模型图,并采用大规模信息网络嵌入(LINE)模型学习异构图节点的嵌入;最后,融合作者的主题偏好和历史发刊记录来计算刊物的综合得分,并据此对投稿作者进行投稿刊物推荐。在两个公开数据集DBLP和PubMed上的实验结果表明,相比奇异值分解(SVD)、DeepWalk、非负矩阵分解(NMF)等6个算法,所提出的算法在不同推荐的投稿刊物列表长度的情况下的召回率均为最优,并且在需要从论文和知识库中获取更少信息的同时,保持了较高的准确性,能有效提高投稿刊物推荐算法的鲁棒性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    29. 时空轨迹序列模式挖掘方法综述
    康军, 黄山, 段宗涛, 李宜修
    《计算机应用》唯一官方网站    2021, 41 (8): 2379-2385.   DOI: 10.11772/j.issn.1001-9081.2020101571
    摘要393)      PDF (1204KB)(1105)    收藏
    在全球定位、移动通信技术迅速发展的背景下涌现出了海量的时空轨迹数据,这些数据是对移动对象在时空环境下的移动模式和行为特征的真实写照,蕴含了丰富的信息,这些信息对于城市规划、交通管理、服务推荐、位置预测等领域具有重要的应用价值,而时空轨迹数据在这些领域的应用通常需要通过对时空轨迹数据进行序列模式挖掘才能得以实现。时空轨迹序列模式挖掘旨在从时空轨迹数据集中找出频繁出现的序列模式,例如: 位置模式(频繁轨迹、热点区域)、活动周期模式、语义行为模式,从而挖掘时空数据中隐藏的信息。总结近年来时空轨迹序列模式挖掘的研究进展,先介绍时空轨迹序列的数据特点及应用,再描述时空轨迹模式的挖掘过程:从基于时空轨迹序列来挖掘位置模式、周期模式、语义模式这三个方面来介绍该领域的研究情况,最后阐述现有时空轨迹序列模式挖掘方法存在的问题,并展望时空轨迹序列模式挖掘方法未来的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    30. 面向工作者能力评估的众包任务分配方法的研究进展综述
    马华, 陈跃鹏, 唐文胜, 娄小平, 黄卓轩
    《计算机应用》唯一官方网站    2021, 41 (8): 2232-2241.   DOI: 10.11772/j.issn.1001-9081.2020101629
    摘要142)      PDF (1533KB)(366)    收藏
    随着互联网技术和共享经济模式的快速发展,作为一种新型的群体计算模式,近年来众包(Crowdsourcing)已经得到了广泛的应用并成为研究热点。针对众包应用的特点,为确保众包任务的完成质量,现有研究从工作者能力评估的角度出发已提出了各种不同的众包任务分配方法。首先介绍了众包的概念和分类,阐述了众包平台的工作流程及其任务特点,并在此基础上总结了现有的工作者能力评估的相关研究工作;然后从基于匹配、基于规划和基于角色协同等三个方面综述了众包任务分配方法及其遇到的挑战;最后提出了未来工作的研究方向。
    参考文献 | 相关文章 | 多维度评价
2022年 42卷 6期
刊出日期: 2022-06-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会