摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部

    当前位置: 两年内
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于改进YOLOv8的嵌入式道路裂缝检测算法
    耿焕同, 刘振宇, 蒋骏, 范子辰, 李嘉兴
    《计算机应用》唯一官方网站    2024, 44 (5): 1613-1618.   DOI: 10.11772/j.issn.1001-9081.2023050635
    摘要2297)   HTML79)    PDF (2002KB)(3385)    收藏

    在边缘端设备部署YOLOv8L模型进行道路裂缝检测可以实现较高的精度,但难以保证实时检测。针对此问题,提出一种可部署到边缘计算设备Jetson AGX Xavier上的基于改进YOLOv8模型的目标检测算法。首先,利用部分卷积设计Faster Block结构以替换YOLOv8 C2f模块中的Bottleneck结构,并将改进后的C2f模块记为C2f-Faster;其次,在YOLOv8主干网络中的每个C2f-Faster模块之后接一个SE(Squeeze-and-Excitation)通道注意力层,进一步提高检测的精度。在开源道路损害数据集RDD20(Road Damage Detection 20)上的实验结果表明:所提方法的平均F1得分为0.573,每秒检测帧数(FPS)为47,模型大小为55.5 MB,相较于GRDDC2020 (Global Road Damage Detection Challenge 2020)的SOTA(State-Of-The-Art)模型,F1得分提高了0.8个百分点,FPS提高了291.7%,模型大小减小了41.8%,实现了在边缘设备上对道路裂缝实时且准确的检测。

    图表 | 参考文献 | 相关文章 | 多维度评价
    2. 大语言模型的技术应用前景与风险挑战
    徐月梅, 胡玲, 赵佳艺, 杜宛泽, 王文清
    《计算机应用》唯一官方网站    2024, 44 (6): 1655-1662.   DOI: 10.11772/j.issn.1001-9081.2023060885
    摘要1652)   HTML110)    PDF (1142KB)(2401)    收藏

    针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-Trained Transformer)等语言模型为代表,综述LLM的发展脉络、核心技术和评估体系;其次,分析LLM现存的技术局限和安全风险;最后,提出LLM在技术上改进、政策上跟进的建议。分析指出作为发展阶段的LLM,现有模型存在非真实性及偏见性输出、实时自主学习能力欠缺,算力需求庞大,对数据质量和数量依赖性强,语言风格单一;存在数据隐私、信息安全和伦理等方面的安全风险。未来发展可从技术上继续改进,从“大规模”转向“轻量化”、从“单模态”走向“多模态”、从“通用”迈入“垂类”;从政策上实时跟进,实施有针对性的监管措施,规范应用和发展。

    图表 | 参考文献 | 相关文章 | 多维度评价
    3. YOLO算法及其在自动驾驶场景中目标检测综述
    邓亚平, 李迎江
    《计算机应用》唯一官方网站    2024, 44 (6): 1949-1958.   DOI: 10.11772/j.issn.1001-9081.2023060889
    摘要1597)   HTML43)    PDF (1175KB)(946)    收藏

    自动驾驶场景下的目标检测是计算机视觉中重要研究方向之一,确保自动驾驶汽车对物体进行实时准确的目标检测是研究重点。近年来,深度学习技术迅速发展并被广泛应用于自动驾驶领域中,极大促进了自动驾驶领域的进步。为此,针对YOLO(You Only Look Once)算法在自动驾驶领域中的目标检测研究现状,从以下4个方面分析。首先,总结单阶段YOLO系列检测算法思想及其改进方法,分析YOLO系列算法的优缺点;其次,论述YOLO算法在自动驾驶场景下目标检测中的应用,从交通车辆、行人和交通信号识别这3个方面分别阐述和总结研究现状及应用情况;此外,总结目标检测中常用的评价指标、目标检测数据集和自动驾驶场景数据集;最后,展望目标检测存在的问题和未来发展方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    4. 大语言模型综述与展望
    秦小林, 古徐, 李弟诚, 徐海文
    《计算机应用》唯一官方网站    2025, 45 (3): 685-696.   DOI: 10.11772/j.issn.1001-9081.2025010128
    摘要1289)   HTML110)    PDF (2035KB)(2661)    收藏

    大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    5. 基于解耦注意力机制的多变量时序预测模型
    李力铤, 华蓓, 贺若舟, 徐况
    《计算机应用》唯一官方网站    2024, 44 (9): 2732-2738.   DOI: 10.11772/j.issn.1001-9081.2023091301
    摘要1278)   HTML11)    PDF (1545KB)(2198)    收藏

    针对多变量时序预测难以充分利用序列上下文语义信息及变量间隐含关联信息的问题,提出一种基于解耦注意力机制的多变量时序预测模型Decformer。首先,提出一种解耦注意力机制,从而充分利用嵌入的语义信息提升注意力权值分配的准确度;其次,提出一种不依赖于显式变量关系的模式关联挖掘方法,以挖掘并利用变量间隐含的模式关联信息。在话务量、电力消耗和交通3种不同类型的真实数据集(TTV、ECL和PeMS-Bay)上,与长短期时间序列网络(LSTNet)、Transformer、FEDformer等优秀的开源多变量时序预测模型相比,Decformer在所有预测时间长度上都取得了最高的预测精度。相较于LSTNet,Decformer在TTV、ECL和PeMS-Bay数据集上的平均绝对误差(MAE)分别降低了17.73%~27.32%、10.89%~17.01%和13.03%~19.64%;均方误差(MSE)分别降低了23.53%~58.96%、16.36%~23.56%和15.91%~26.30%。实验结果表明,Decformer能够有效提升多变量时序预测的精度。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 不完整多视图聚类综述
    董瑶, 付怡雪, 董永峰, 史进, 陈晨
    《计算机应用》唯一官方网站    2024, 44 (6): 1673-1682.   DOI: 10.11772/j.issn.1001-9081.2023060813
    摘要1226)   HTML20)    PDF (2050KB)(1262)    收藏

    多视图聚类是近年来图数据挖掘领域的研究热点。由于数据采集技术的限制或人为因素等原因常导致视图或样本缺失问题。降低多视图的不完整性对聚类效果的影响是多视图聚类目前面临的重大挑战。因此,综合研究不完整多视图聚类(IMC)近年的发展具有重要的理论意义和实践价值。首先,归纳分析不完整多视图数据缺失类型;其次,详细比较基于多核学习(MKL)、矩阵分解(MF)学习、深度学习和图学习这4类IMC方法,分析代表性方法的技术特点和区别;再次,从数据集类型、视图和类别数量、应用领域等角度总结22个公开不完整多视图数据集;继次,总结评价指标,并系统分析现有不完整多视图聚类方法在同构和异构数据集上的性能表现;最后,归纳分析不完整多视图聚类目前存在的问题、未来的发展方向和现有应用领域。

    图表 | 参考文献 | 相关文章 | 多维度评价
    7. 基于元图同构网络的分子毒性预测
    黄云川, 江永全, 黄骏涛, 杨燕
    《计算机应用》唯一官方网站    2024, 44 (9): 2964-2969.   DOI: 10.11772/j.issn.1001-9081.2023091286
    摘要1209)   HTML8)    PDF (1150KB)(428)    收藏

    为了获得更准确的分子毒性预测结果,提出基于元图同构网络的分子毒性预测模型Meta-MTP。首先,使用图同构神经网络将原子作为节点、键作为边、分子作为图结构,以获取分子表征;使用预训练模型对图同构网络(GIN)初始化,使它获得更好的参数;引入基于分层注意力和局部增强的前馈Transformer;使用原子类型预测和键预测作为辅助任务提取更多的分子内部信息;通过元学习双层优化策略对模型进行训练;最后使用Tox21和SIDER数据集对模型进行训练。实验结果表明,在Tox21和SIDER数据集上,Meta-MTP具有良好的分子毒性预测能力,当样本数为10时,相较于FSGNNTR(Few-Shot Graph Neural Network-TRansformer)模型,Meta-MTP的曲线下面积(AUC)分别提高了1.4%和5.4%,相较于图同构网络(GIN)、图卷积网络(GCN)和GraphSAGE(Graph Sample and AGgrEgate)3种传统的图神经网络模型,Meta-MTP的AUC提高了18.3%~23.7%和7.3%~22.2%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 应对零日攻击的混合车联网入侵检测系统
    方介泼, 陶重犇
    《计算机应用》唯一官方网站    2024, 44 (9): 2763-2769.   DOI: 10.11772/j.issn.1001-9081.2023091328
    摘要1142)   HTML15)    PDF (2618KB)(2691)    收藏

    现有机器学习方法在面对零日攻击检测时,存在对样本数据过度依赖以及对异常数据不敏感的问题,从而导致入侵检测系统(IDS)难以有效防御零日攻击。因此,提出一种基于Transformer和自适应模糊神经网络推理系统(ANFIS)的混合车联网入侵检测系统。首先,设计了一种数据增强算法,通过先去除噪声再生成的方法解决了数据样本不平衡的问题;其次,将非线性特征交互引入复杂的特征组合,设计了一个特征工程模块;最后,将Transformer的自注意力机制和ANFIS的自适应学习方法相结合,以提高特征表征能力,减少对样本数据的依赖。在CICIDS-2017和UNSW-NB15入侵数据集上将所提系统与Dual-IDS等先进(SOTA)算法进行比较。实验结果表明,对于零日攻击,所提系统在CICIDS-2017入侵数据集上实现了98.64%的检测精确率和98.31%的F1值,在UNSW-NB15入侵数据集上实现了93.07%的检测精确率和92.43%的F1值,验证了所提算法在零日攻击检测方面的高准确性和强泛化能力。

    图表 | 参考文献 | 相关文章 | 多维度评价
    9. 融合1D-CNN与BiGRU的类不平衡流量异常检测
    陈虹, 齐兵, 金海波, 武聪, 张立昂
    《计算机应用》唯一官方网站    2024, 44 (8): 2493-2499.   DOI: 10.11772/j.issn.1001-9081.2023081112
    摘要1120)   HTML4)    PDF (1194KB)(1801)    收藏

    网络流量异常检测是利用各种检测技术分析判断网络流量,发现网络中潜在的攻击,是一种有效的网络安全防护方法。针对高维海量数据和不同攻击类别的网络流量数据不均衡而导致检测准确率低、误报率高的问题,提出一种融合一维卷积神经网络(1D-CNN)和双向门控循环单元(BiGRU)的类不平衡流量异常检测模型。首先,针对类不平衡数据,通过使用改进的合成少数类过采样技术(SMOTE)即Borderline-SMOTE和基于高斯混合模型(GMM)的欠采样聚类技术进行平衡处理;然后,使用1D-CNN提取数据的局部特征,并利用BiGRU更好地提取数据中的时序特征;最后,在UNSW-NB15数据集对所提模型进行验证,所提模型的准确率为98.12%,误报率为1.28%。结果表明,所提模型提高了对少数攻击的识别率,检测精度高于其他经典机器学习和深度学习模型。

    图表 | 参考文献 | 相关文章 | 多维度评价
    10. 区块链3.0的发展、技术与应用
    方鹏, 赵凡, 王保全, 王轶, 蒋同海
    《计算机应用》唯一官方网站    2024, 44 (12): 3647-3657.   DOI: 10.11772/j.issn.1001-9081.2023121826
    摘要1113)   HTML43)    PDF (2294KB)(410)    收藏

    区块链3.0是区块链技术发展的第3阶段,也是构建价值互联网的内核,它在分片、跨链以及隐私保护等方面的创新使它具有广泛的应用场景和研究价值,受到学术界和产业界相关人士的高度重视。针对区块链3.0的发展、技术与应用,调研并综述近5年国内外关于区块链3.0的相关文献。首先,介绍区块链的基本理论和技术特点,为深入了解区块链的研究进展奠定基础;其次,根据区块链技术随时间变化的演进趋势,阐述区块链3.0的发展历程和各个关键的发展时间节点,并给出以分片和侧链技术为基准点划分区块链不同的发展阶段的理由;再次,详细分析区块链3.0关键技术的研究现状,概述归纳它在物联网、医疗和农业等6大领域内的典型应用;最后,总结区块链3.0在发展过程中面临的关键性挑战和未来发展机遇。

    图表 | 参考文献 | 相关文章 | 多维度评价
    11. 基于多级特征双向融合的小目标检测优化模型
    潘烨新, 杨哲
    《计算机应用》唯一官方网站    2024, 44 (9): 2871-2877.   DOI: 10.11772/j.issn.1001-9081.2023091274
    摘要1090)   HTML11)    PDF (1447KB)(407)    收藏

    由于自身特征较小以及网络的深度造成特征丢失等客观原因,小目标的检测一直是目标检测领域的难点问题。针对以上问题,提出基于网络结构进行多次特征增强以优化小目标检测的模型。首先,替换主干网络中的空间金字塔池化(SPP)以优化梯度计算;其次,对网络颈部实行区分特征级别的多级双向融合,并对输出头添加自适应特征融合(AFF)模块,以实现多级的特征增强。实验结果表明,在COCO2017-val数据集上,当交并比(IoU)为0.5时,所提模型的平均精度均值达到61.4%,与目前较流行的YOLOv7模型相比提高了4.7个百分点,同时在单GPU上模型的检测帧率为78.2 frame/s,满足工业检测速度要求。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 联邦学习中的安全威胁与防御措施综述
    陈学斌, 任志强, 张宏扬
    《计算机应用》唯一官方网站    2024, 44 (6): 1663-1672.   DOI: 10.11772/j.issn.1001-9081.2023060832
    摘要1013)   HTML23)    PDF (1072KB)(1846)    收藏

    联邦学习是一种用于解决机器学习中数据共享问题和隐私保护问题的分布式学习方法,旨在多方共同训练一个机器学习模型并保护数据的隐私;但是,联邦学习本身存在安全威胁,这使得联邦学习在实际应用中面临巨大的挑战,因此,分析联邦学习面临的攻击和相应的防御措施对联邦学习的发展和应用至关重要。首先,介绍联邦学习的定义、流程和分类,联邦学习中的攻击者模型;其次,从联邦学习系统的鲁棒性和隐私性两方面介绍可能遭受的攻击,并介绍不同攻击相应的防御措施,同时也指出防御方案的不足;最后,展望安全的联邦学习系统。

    图表 | 参考文献 | 相关文章 | 多维度评价
    13. 基于密集残差物理信息神经网络的各向异性旅行时计算方法
    赵亦群, 张志禹, 董雪
    《计算机应用》唯一官方网站    2024, 44 (7): 2310-2318.   DOI: 10.11772/j.issn.1001-9081.2023070915
    摘要1006)   HTML22)    PDF (7009KB)(779)    收藏

    针对目前利用物理信息神经网络计算旅行时只是应用在各向同性介质上、在远离震源时误差较大和效率低等问题,而有限差分法、试射法和弯曲法等方法在多震源、高密度网格上计算成本高等问题,提出一种密集残差物理信息神经网络计算各向异性介质旅行时的方法。首先推导了各向异性因式分解后的程函方程作为损失函数项;其次引入局部自适应反正切函数为激活函数和L-BFGS-B(Limited-memory Broyden-Fletcher-Goldfarb-Shanno-B)作为优化器;最后在网络中采用分段式训练的方式,先训练深层密集残差网络,然后冻结其参数,再训练具有物理意义的浅层密集残差网络,从而评估网络得到旅行时。实验结果表明,所提方法在均匀速度模型下的旅行时最大绝对误差达到了0.015 8 μs,其他速度模型下平均绝对误差平均下降了两个数量级,在效率方面也平均提高了1倍,明显优于快速扫描法。

    图表 | 参考文献 | 相关文章 | 多维度评价
    14. 基于自注意力融合的不完整多视图聚类算法
    李顺勇, 李师毅, 胥瑞, 赵兴旺
    《计算机应用》唯一官方网站    2024, 44 (9): 2696-2703.   DOI: 10.11772/j.issn.1001-9081.2023091253
    摘要1006)   HTML15)    PDF (2806KB)(1259)    收藏

    基于不完整数据的多视图聚类任务已经成为无监督学习领域的研究热点之一。然而大多数基于“浅层”模型的多视图聚类算法通常在面对大规模高维数据时难以提取和刻画视图内的潜在特征结构;同时,堆叠或求平均的多视图信息融合方式忽视了视图之间的差异性,没有充分考虑各视图对构建公共一致表示的不同贡献。针对以上问题,提出一种基于自注意力融合的不完整多视图聚类算法(IMVCSAF)。首先,基于深度自编码器提取各视图的潜在特征,并采用对比学习的方式最大化各视图间的一致性信息;其次,采用自注意力机制对各视图的潜在表示进行重新编码和融合,并全面考虑和挖掘不同视图之间的内在因果性和特征互补性;再次,基于公共一致表示对缺失实例样本的潜在表示进行预测和恢复,从而完整地实现多视图聚类的过程。在Scene-15、LandUse-21、Caltech101-20和Noisy-MNIST数据集上的实验结果表明,IMVCSAF在满足收敛性要求的前提下得到的准确率均高于其他对比算法,而在50%缺失率的Noisy-MNIST数据集上,IMVCSAF的准确率比次优的COMPLETER(inCOMPlete muLti-view clustEring via conTrastivE pRediction)算法提高了6.58个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    15. 超图应用方法综述:问题、进展与挑战
    曾蠡, 杨婧如, 黄罡, 景翔, 罗超然
    《计算机应用》唯一官方网站    2024, 44 (11): 3315-3326.   DOI: 10.11772/j.issn.1001-9081.2023111629
    摘要964)   HTML27)    PDF (795KB)(513)    收藏

    超图是图的泛化,相较于普通图,它在复杂关系的高阶特征表达上具有显著优势。作为一种相对较新的数据结构,超图在应用领域正在发挥越来越大的作用,研究者采用超图模型及算法对现实世界中的具体问题进行建模、求解,有效地提升了解决问题的效率及质量。现有对超图的综述更多侧重于解决超图本身问题的理论及技术,缺乏对超图在具体应用场景下的建模及求解方法的归纳总结。为此,在总结介绍超图的一些基础概念后,分析了超图在各个主流应用场景下的应用方法、技术、共性问题及解决方案;通过对现有工作的归纳总结,阐述了超图运用于现实问题中仍然存在的一些问题与障碍;最后,对超图应用的未来研究方向进行了展望。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. 基于层间引导的低光照图像渐进增强算法
    黄梦源, 常侃, 凌铭阳, 韦新杰, 覃团发
    《计算机应用》唯一官方网站    2024, 44 (6): 1911-1919.   DOI: 10.11772/j.issn.1001-9081.2023060736
    摘要961)   HTML8)    PDF (6161KB)(222)    收藏

    低光照图像的图像质量通常较低,低光照图像增强(LLIE)旨在提高这类图像的视觉质量。针对现有的LLIE算法大多专注增强亮度和对比度、忽略细节增强的问题,提出一个基于层间引导的低光照图像渐进增强算法(PELG),兼顾图像亮度和细节增强。首先,使用拉普拉斯金字塔(LP)降低任务复杂度,提高算法效率;其次,利用各频率分量间的相关性,在低频和高频分量之间构建基于Transformer的层间引导融合模块,在各高频分量之间构建轻量级的层间引导融合模块,有效精炼金字塔较低层增强信息指导较高层处理图像,实现基于层间引导的渐进增强;最后,通过LP重建亮度均匀、细节清晰的增强图像。实验结果表明,所提算法的峰值信噪比(PSNR)在LOL(LOw-Light dataset)-v1上比DSLR(Deep Stacked Laplacian Restorer)高2.3 dB,在LOL-v2上比UNIE(Unsupervised Night Image Enhancement)高0.55 dB;与其他基于深度学习的LLIE算法相比,所提算法运行速度快,增强结果在客观和主观质量上均获得明显提升,更适用于实际场景。

    图表 | 参考文献 | 相关文章 | 多维度评价
    17. 基于多尺度时空图卷积网络的交通出行需求预测
    李欢欢, 黄添强, 丁雪梅, 罗海峰, 黄丽清
    《计算机应用》唯一官方网站    2024, 44 (7): 2065-2072.   DOI: 10.11772/j.issn.1001-9081.2023071045
    摘要959)   HTML17)    PDF (1969KB)(379)    收藏

    满足公众高质量出行需求是智能交通系统(ITS)的主要挑战之一。目前,针对公共交通出行需求预测问题,现有模型大多采用固定结构的图描述出行需求的空间相关性,忽略了出行需求在不同尺度下具有不同的空间依赖关系。针对上述问题,提出一种多尺度时空图卷积网络(MSTGCN)模型。该模型首先从全局尺度和局部尺度构建全局需求相似图和局部需求相似图,这2种图可以捕获公共交通出行需求长期内较为稳定的全局特征和短期内动态变化的局部特征。利用图卷积网络(GCN)提取2种图中的全局空间信息和局部空间信息,并引入注意力机制融合两种空间信息。为了拟合时间序列中潜藏的时间依赖关系,利用门控循环单元(GRU)捕捉公共交通需求的时变特征。采用纽约市出租车订单数据集和自行车订单数据集进行实验,结果表明MSTGCN模型在自行车订单数据集上均方根误差(RMSE)、平均绝对误差(MAE)和皮尔逊相关系数(PCC)达2.788 6、1.737 1、0.799 2,在出租车订单数据集上RMSE、MAE、PCC达9.573 4、5.861 2、0.963 1。可见,MSTGCN模型可以有效地挖掘公共交通出行需求的多尺度时空特性,对未来公共交通出行需求进行准确预测。

    图表 | 参考文献 | 相关文章 | 多维度评价
    18. 基于不确定度感知的帧关联短视频事件检测方法
    李云, 王富铕, 井佩光, 王粟, 肖澳
    《计算机应用》唯一官方网站    2024, 44 (9): 2903-2910.   DOI: 10.11772/j.issn.1001-9081.2023091242
    摘要949)   HTML3)    PDF (2161KB)(382)    收藏

    针对如何联合短视频的帧不确定度和时序关联性,以增强事件检测能力的问题,提出一种基于不确定度感知的帧关联短视频事件检测方法。首先,利用2D卷积神经网络(CNN)提取短视频每一帧的特征,再将该特征多次前向传播并通过贝叶斯变分层获得特征均值和与特征对应的不确定度信息;其次,利用模型构建的不确定度感知模块将特征均值和不确定度信息进行融合,再将融合后所得的各帧特征通过时序关联模块加强时域上的联系;最后,用时域关联后的特征通过分类网络实现短视频事件检测。在从Flickr平台上爬取到的短视频事件检测数据集上开展实验对比,实验结果表明,支持向量机(SVM)等子空间学习方法的分类性能较差,对高级语义表示的探索不充分;而深度学习方法对于事件检测的准确率明显更优。相较于SViTT(Sparse Video-Text Transformer)方法,所提方法的准确率、平均召回率和平均精度分别提高了3.37%、2.55%和2.09%,验证了所提方法在短视频事件检测任务上的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    19. 基于自注意力机制与图卷积的3D目标检测网络
    刘越, 刘芳, 武奥运, 柴秋月, 王天笑
    《计算机应用》唯一官方网站    2024, 44 (6): 1972-1977.   DOI: 10.11772/j.issn.1001-9081.2023060767
    摘要944)   HTML12)    PDF (3215KB)(1220)    收藏

    针对三维(3D)目标检测过程中对骑行者、行人等小目标检测的准确性较低,难以适应城市复杂路况的问题,提出一种基于自注意力机制与图卷积的3D目标检测网络。首先,为获取更具有判别性的小目标特征,在主干网络中引入自注意力机制,使网络对小目标特征更敏感,增强网络特征的提取能力;其次,在自注意力机制的基础上构建特征融合模块,进一步丰富浅层网络特征,增强深层网络的特征表达能力;最后,引用动态图卷积预测目标的边界框,提高目标预测的准确性。在KITTI数据集上进行实验,将所提网络与TANet(Triple Attention Network)、IA-SSD(Instance-Aware Single-Stage Detector)等8种主流网络对比。实验结果表明,所提网络对行人的检测精度在简单、中等和困难这3个难度下比行人检测精度次优的TANet提高了12.12、13.82和11.03个百分点,对骑行者的检测精度在中等和困难上比IA-SSD提高了3.06和5.34个百分点。综上所述,所提网络可以更好地应用于小目标检测任务。

    图表 | 参考文献 | 相关文章 | 多维度评价
    20. 基于Transformer的视觉目标跟踪方法综述
    孙子文, 钱立志, 杨传栋, 高一博, 陆庆阳, 袁广林
    《计算机应用》唯一官方网站    2024, 44 (5): 1644-1654.   DOI: 10.11772/j.issn.1001-9081.2023060796
    摘要942)   HTML22)    PDF (1615KB)(2431)    收藏

    视觉目标跟踪是计算机视觉中的重要任务之一,为实现高性能的目标跟踪,近年来提出了大量的目标跟踪方法,其中基于Transformer的目标跟踪方法由于具有全局建模和联系上下文的能力,是目前视觉目标跟踪领域研究的热点。首先,根据网络结构的不同对基于Transformer的视觉目标跟踪方法进行分类,概述相关原理和模型改进的关键技术,总结不同网络结构的优缺点;其次,对这类方法在公开数据集上的实验结果进行对比,分析网络结构对性能的影响,其中MixViT-L(ConvMAE)在LaSOT和TrackingNet上跟踪成功率分别达到了73.3%和86.1%,说明基于纯Transformer两段式架构的目标跟踪方法具有更优的性能和更广的发展前景;最后,对方法当前存在的网络结构复杂、参数量大、训练要求高和边缘设备使用难度大等不足进行总结,并对今后的研究重点进行展望,通过与模型压缩、自监督学习以及Transformer可解释性分析相结合,可为基于Transformer的视觉目标跟踪提出更多可行的解决方案。

    图表 | 参考文献 | 相关文章 | 多维度评价
    21. 结合自我特征和对比学习的推荐模型
    杨兴耀, 陈羽, 于炯, 张祖莲, 陈嘉颖, 王东晓
    《计算机应用》唯一官方网站    2024, 44 (9): 2704-2710.   DOI: 10.11772/j.issn.1001-9081.2023091264
    摘要941)   HTML12)    PDF (1737KB)(684)    收藏

    针对图神经网络推荐中图卷积在消息传递过程的嵌入表示过平滑和噪声问题,提出一种结合自我特征和对比学习的推荐模型(SfCLRec)。采用预训练-正式训练架构训练模型,首先预训练用户和项目的嵌入表示,通过融合节点自我特征维持节点本身的特征唯一性,并引入层级对比学习任务减少来自高阶邻居节点中的噪声;其次,在正式训练阶段根据评分机制重新构建协同图邻接矩阵;最后,根据最终嵌入得到预测评分。实验结果表明,相较于LightGCN、SimGCL(Simple Graph Contrastive Learning)等现有图神经网络推荐模型,SfCLRec在3个公开数据集ML-latest-small、Last.FM和Yelp中均取得了较好的召回率和归一化折损累计增益(NDCG),验证了SfCLRec的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    22. 基于时空信息的轻量视频显著性目标检测网络
    徐松, 张文博, 王一帆
    《计算机应用》唯一官方网站    2024, 44 (7): 2192-2199.   DOI: 10.11772/j.issn.1001-9081.2023070926
    摘要935)   HTML9)    PDF (2111KB)(866)    收藏

    现有视频显著性目标检测(VSOD)网络面临2个问题:一是在捕获时间信息时计算成本过大,导致网络难以在移动端实际应用;二是网络泛化能力较弱,难以处理视频中诸如遮挡、运动模糊等挑战性场景。因此,提出一种基于动态滤波器和对比学习思想的轻量视频显著性目标检测网络。首先,对连续帧的每帧图像进行粗略的前景特征点采样并进行相似度矩阵的计算,利用相似度矩阵进行加权从而滤除存在的噪声特征;其次,用滤波后的前景特征生成动态滤波器参数,对原始特征图执行卷积操作以提取前景物体;同时在训练阶段设计了一个对比学习模块帮助网络学习,在推理阶段并不会引入额外的计算量。在三个数据集DAVIS、DAVSOD和VOS上进行了广泛实验,实验结果表明,所提网络相较于DCFNet (Dynamic Context-sensitive Filtering Network for video salient object detection),在F-measure、S-measure以及平均绝对误差(MAE)3个指标上性能接近,帧率从28 frame/s提升到38 frame/s,提升了35.7%,同时网络参数量仅有15.6×106,更有利于实际应用中在边缘侧进行部署。

    图表 | 参考文献 | 相关文章 | 多维度评价
    23. 降低跨分片交易比例的区块链分片方法
    李皎, 张秀山, 宁远航
    《计算机应用》唯一官方网站    2024, 44 (6): 1889-1896.   DOI: 10.11772/j.issn.1001-9081.2023060757
    摘要934)   HTML8)    PDF (2573KB)(290)    收藏

    针对分片技术在优化区块链性能时引起的跨分片交易比例过高、跨分片交易验证复杂的问题,提出一种降低跨分片交易比例的区块链分片方法。首先,从数据分片的角度出发,构造区块链交易分片模型,并给出分片性能评价指标;其次,针对区块链中长期积累的交易数据,从账号关联性角度出发,构造发送方和接收方的交易频次集合;最后,设计考虑交易频次的区块链交易分片算法(FBTS),从而解决交易分片中跨分片比例过高的问题。在分片粒度为2、3、5、7、15、20、30和50的情况下,所提算法在跨分片交易比例、账号平均跨分片次数、账号的加权平均跨分片次数等性能指标方面均优于随机分片算法(RSA)和取模分片算法(MSA)。另外所提算法的大多数账号和交易量都集中分布在低跨分片次数处,说明交易的完成不需要多次跨分片。实验结果表明,所提算法可以有效地降低跨分片交易比例,缩短跨分片的交易的时延。

    图表 | 参考文献 | 相关文章 | 多维度评价
    24. 时频域多尺度交叉注意力融合的时间序列分类方法
    王美, 苏雪松, 刘佳, 殷若南, 黄珊
    《计算机应用》唯一官方网站    2024, 44 (6): 1842-1847.   DOI: 10.11772/j.issn.1001-9081.2023060731
    摘要928)   HTML12)    PDF (2511KB)(1186)    收藏

    针对时间序列子序列间的潜在信息交互不足导致分类准确率低的问题,提出时频域多尺度交叉注意力融合的时间序列分类方法TFFormer(Time-Frequency Transformer)。首先,将原始时间序列的时频域谱分别划分为等长子序列,经线性投影后加入位置信息解决时间序列的点值耦合问题;其次,通过改进的多头自注意力(IMHA)模块使模型关注更重要的序列特征,解决长时间序列的前后依赖问题;最后,构造多尺度时频域交叉注意力(CMA)模块增强时间序列在时域和频域之间的信息交互,使模型进一步挖掘序列的频域信息。实验结果表明,在Trace、StarLightCurves和UWaveGestureLibraryAll数据集上,相较于全卷积网络(FCN),所提方法的分类准确率分别提高了0.3、0.9和1.4个百分点,验证了通过增强时间序列时域和频域间的信息交互,可以提高模型收敛速度和分类精度。

    图表 | 参考文献 | 相关文章 | 多维度评价
    25. 基于深度强化学习的移动机器人三维路径规划方法
    马天, 席润韬, 吕佳豪, 曾奕杰, 杨嘉怡, 张杰慧
    《计算机应用》唯一官方网站    2024, 44 (7): 2055-2064.   DOI: 10.11772/j.issn.1001-9081.2023060749
    摘要926)   HTML30)    PDF (5732KB)(1160)    收藏

    针对三维未知环境中存在的高复杂度和不确定性的问题,提出一种在有限观测空间优化策略下基于深度强化学习的移动机器人三维路径规划方法。首先,在有限观测空间下采用深度图信息作为智能体的输入,模拟移动受限且未知的复杂三维空间环境;其次,设计了两阶段离散动作空间下的动作选择策略,包括方向动作和位移动作,以减少搜索步数和时间;最后,在近端策略优化(PPO)算法基础上,添加门控循环单元(GRU)结合历史状态信息,以提升未知环境中搜索策略的稳定性,进而提高规划路径准确度和平滑度。实验结果表明,相较于A2C(Advantage Actor-Critic),所提方法的平均搜索时间缩短了49.07%,平均规划路径长度缩短了1.04%,同时能够完成线性时序逻辑约束下的多目标路径规划任务。

    图表 | 参考文献 | 相关文章 | 多维度评价
    26. 优化场景视角下的进化多任务优化综述
    赵佳伟, 陈雪峰, 冯亮, 候亚庆, 朱泽轩, Yew‑Soon Ong
    《计算机应用》唯一官方网站    2024, 44 (5): 1325-1337.   DOI: 10.11772/j.issn.1001-9081.2024020208
    摘要926)   HTML74)    PDF (1383KB)(2577)    收藏

    随着优化问题变得日益复杂,传统的进化算法由于计算成本高昂和适用性有限而面临挑战。为了克服这些挑战,基于知识迁移的进化多任务优化(EMTO)算法应运而生,它的核心思想是通过跨任务的知识共享,同时解决多个优化问题,旨在提高进化算法在应对复杂优化场景的效率。全面总结了当前进化多任务优化研究的进展,与已有综述文章相比,从不同的研究视角进行深入探讨,并指出了现有文献中对优化场景视角分析的缺失。鉴于此,从优化问题的应用场景出发,对适用于进化多任务优化的场景及其基本解决策略进行了系统性的阐述,以帮助研究人员准确地根据具体应用需求选择合适的研究方法。此外,深入讨论进化多任务优化当前面临的挑战和未来的研究方向,旨在为未来的研究提供指导和启示。

    图表 | 参考文献 | 相关文章 | 多维度评价
    27. 较短的长序列时间序列预测模型
    徐泽鑫, 杨磊, 李康顺
    《计算机应用》唯一官方网站    2024, 44 (6): 1824-1831.   DOI: 10.11772/j.issn.1001-9081.2023060799
    摘要903)   HTML22)    PDF (2751KB)(150)    收藏

    针对现有的研究大多将短序列时间序列预测和长序列时间序列预测分开研究而导致模型在较短的长序列时序预测时精度较低的问题,提出一种较短的长序列时间序列预测模型(SLTSFM)。首先,利用卷积神经网络(CNN)和PBUSM(Probsparse Based on Uniform Selection Mechanism)自注意力机制搭建一个序列到序列(Seq2Seq)结构,用于提取长序列输入的特征;其次,设计“远轻近重”策略将多个短序列输入特征提取能力较强的长短时记忆(LSTM)模块提取的各时段数据特征进行重分配;最后,用重分配的特征增强提取的长序列输入特征,提高预测精度并实现时序预测。利用4个公开的时间序列数据集验证模型的有效性。实验结果表明,与综合表现次优的对比模型循环门单元(GRU)相比,SLTSFM的平均绝对误差(MAE)指标在4个数据集上的单变量时序预测分别减小了61.54%、13.48%、0.92%和19.58%,多变量时序预测分别减小了17.01%、18.13%、3.24%和6.73%。由此可见SLTSFM在提升较短的长序列时序预测精度方面的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    28. 基于图神经网络的多层信息交互融合算法用于会话推荐
    杨航, 李汪根, 张根生, 王志格, 开新
    《计算机应用》唯一官方网站    2024, 44 (9): 2719-2725.   DOI: 10.11772/j.issn.1001-9081.2023091255
    摘要889)   HTML9)    PDF (1517KB)(187)    收藏

    针对当前会话推荐中存在对于当前会话的项目转换信息挖掘不充分且极少利用其他会话信息的问题,提出一种基于图神经网络的多层信息交互融合算法用于会话推荐。基于当前会话,首先,对节点之间的连接关系设计不同的权重聚合邻域节点的信息,并挖掘当前会话中项目转换的显性信息;其次,通过基于堆叠的残差图注意力网络聚合邻域节点信息,挖掘当前会话中项目转换的隐性信息;最后,通过单门控图神经网络挖掘基于时间戳的会话中存在的序列依赖信息。基于其他会话,通过节点的一阶邻居将整个会话集联系起来,学习全局信息编码,进而融合4个层次的嵌入表示以获得更全面的项目转换信息,同时使用软注意力机制和反向位置嵌入信息对获得的项目转换信息进行更有效的融合。实验结果表明,在Diginetica数据集上,所提模型的精度P@20和平均倒数排名MRR@20较次优模型GCE-GNN(Global Context Enhanced Graph Neural Network)分别提升了0.79%和0.84%;在Tmall数据集上,所提模型的P@20和MRR@20较次优模型HyperS2Rec分别提升了8.23%和7.86%;在Nowplaying数据集上,所提模型的P@20和MRR@20较次优模型HyperS2Rec分别提升了1.33%和7.16%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    29. 在线教育学习者知识追踪综述
    赵雅娟, 孟繁军, 徐行健
    《计算机应用》唯一官方网站    2024, 44 (6): 1683-1698.   DOI: 10.11772/j.issn.1001-9081.2023060852
    摘要886)   HTML22)    PDF (2932KB)(5724)    收藏

    知识追踪(KT)是在线教育中一项基础且具有挑战性的任务,同时也是从学习者的学习历史中建立学习者知识状态模型的任务,可以帮助学习者更好地了解自己的知识状态,使教育者更好地了解学习者的学习情况。对在线教育学习者KT研究进行综述。首先,介绍KT的主要任务和发展历程;其次,从传统KT模型和深度学习KT模型两个方面展开叙述;再次,归纳总结相关数据集和评价指标,并汇总KT的相关应用;最后,总结KT现状,讨论它们的不足和未来发展方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    30. 面向联邦学习的随机验证区块链构建
    陈廷伟, 张嘉诚, 王俊陆
    《计算机应用》唯一官方网站    2024, 44 (9): 2770-2776.   DOI: 10.11772/j.issn.1001-9081.2023091254
    摘要875)   HTML7)    PDF (1975KB)(1869)    收藏

    针对现有联邦学习模型中存在的本地设备模型梯度泄露、中心化服务器设备可随意退出、全局模型无法抵御恶意用户攻击等问题,提出面向联邦学习的随机验证区块链构建及隐私保护方法。首先,引入可验证哈希函数以随机选举区块链的领导节点,确保节点出块的公平性;其次,设计了验证节点的交叉检测机制防御恶意节点的攻击;最后,基于差分隐私技术训练区块链节点,根据节点对模型的贡献程度构建激励规则进行节点激励,提高联邦学习模型的训练准确率。实验结果表明,所提方法在20%恶意节点的情况下,对于恶意节点的投毒攻击能够达到80%的准确率,相较于Google FL提升了61个百分点,而所提方法在噪声方差为10-3时梯度匹配损失比Google FL提升了14个百分点。可见,相较于Google FL等联邦学习方法,所提方法在提升模型的安全性前提下能够保证良好的精确度,具有更好的安全性和鲁棒性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    31. 适用于物联网的区块链轻量化技术综述
    陈姿芊, 牛科迪, 姚中原, 斯雪明
    《计算机应用》唯一官方网站    2024, 44 (12): 3688-3698.   DOI: 10.11772/j.issn.1001-9081.2023121817
    摘要872)   HTML6)    PDF (1709KB)(147)    收藏

    区块链技术凭借去中心化和加密等特性被用于物联网(IoT),然而传统区块链在IoT环境下存在扩展性差、延迟高、密码组件消耗高、共识计算复杂和数据存储规模大等问题。针对传统区块链在IoT设备中性能不佳的问题,对区块链轻量化技术进行综述。首先,将区块链架构分为单链结构和有向无环图(DAG)结构,并比较了两类区块链架构中的轻量化操作;其次,从迭代结构、压缩函数和硬件实现方面分析轻量级hash函数;再次,介绍共识算法和存储中的轻量化方案;最后,结合文献调研成果归纳总结区块链轻量化技术的设计思路,展望未来的研究方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    32. 基于并行异构图和序列注意力机制的中文实体关系抽取模型
    毛典辉, 李学博, 刘峻岭, 张登辉, 颜文婧
    《计算机应用》唯一官方网站    2024, 44 (7): 2018-2025.   DOI: 10.11772/j.issn.1001-9081.2023071051
    摘要872)   HTML20)    PDF (2387KB)(1385)    收藏

    近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。

    图表 | 参考文献 | 相关文章 | 多维度评价
    33. 基于节点结构的点云分类网络
    高文烁, 陈晓云
    《计算机应用》唯一官方网站    2024, 44 (5): 1471-1478.   DOI: 10.11772/j.issn.1001-9081.2023050802
    摘要871)   HTML17)    PDF (2562KB)(1121)    收藏

    点云数据的非结构化和不均匀分布给点云物体特征表示和分类任务带来极大挑战。为了提取点云物体的三维结构特征,现有方法多采用复杂的局部特征提取结构组建分层网络,导致特征提取网络复杂且主要关注点云物体的局部结构。为更好地提取不均匀分布的点云物体特征,提出采样点卷积密度自适应加权的节点结构网络(NsNet)。该卷积网络通过高斯密度对采样点自适应加权以区分采样点的密度差异,从而更好地刻画物体的整体结构;其次,通过加入球形坐标简化网络结构以降低模型复杂度。在3个公开数据集上与PointNet++和PointMLP等方法进行比较,实验结果表明:基于自适应密度加权的NsNet比PointNet++和PointMLP的总准确率(OA)分别提高了9.1和1.3个百分点;与PointMLP相比减少了4.6×106的参数量。NsNet可有效解决点云分布不均导致的边缘点信息损失问题,提高分类精度,降低模型复杂度。

    图表 | 参考文献 | 相关文章 | 多维度评价
    34. 无负采样的正样本增强图对比学习推荐方法PAGCL
    汪炅, 唐韬韬, 贾彩燕
    《计算机应用》唯一官方网站    2024, 44 (5): 1485-1492.   DOI: 10.11772/j.issn.1001-9081.2023050756
    摘要865)   HTML20)    PDF (2404KB)(1255)    收藏

    对比学习(CL)因能够提取数据本身包含的监督信号而被广泛应用于推荐任务。最近的研究表明,CL在推荐方面的成功依赖于对比损失——互信息噪声对比估计(InfoNCE)损失带来的节点分布的均匀性。此外,另一项研究证明贝叶斯个性化排序(BPR)损失的正项与负项分别带来的对齐性和均匀性有助于提高推荐性能。由于在CL框架中对比损失能够带来比BPR负项更强的均匀性,BPR负项存在的必要性值得商榷。实验分析表明在对比框架中BPR的负项是不必要的,并基于这一观察提出了无需负采样的联合优化损失,可应用于经典的CL方法并达到相同或更高的性能。此外,与专注于提高均匀性的研究不同,为进一步加强对齐性,提出一种新颖的正样本增强的图对比学习方法(PAGCL),该方法使用随机正样本在节点表示层面进行扰动。在多个基准数据集上的实验结果表明,PAGCL在召回率及归一化折损累积增益(NDCG)这两个常用指标上均优于SOTA方法自监督图学习(SGL)、简单图对比学习(SimGCL)等,且相较于基模型轻量化图卷积(LightGCN)的NDCG@20提升最大可达17.6%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    35. 基于知识图谱和时空扩散图卷积网络的港口交通流量预测
    薛桂香, 王辉, 周卫峰, 刘瑜, 李岩
    《计算机应用》唯一官方网站    2024, 44 (9): 2952-2957.   DOI: 10.11772/j.issn.1001-9081.2023081100
    摘要864)   HTML2)    PDF (1614KB)(920)    收藏

    由于港口交通流量具有随机不确定性、时间不平稳特征,因此港口交通流量的精准预测是一项具有挑战性的任务。为了提高港口交通流量预测精度,考虑气象条件和港口相邻高速公路开闭状态等外部干扰因素,提出了一种基于知识图谱和时空扩散图卷积网络的港口交通流量预测算法KG-DGCN-GRU。知识图谱表示港口交通网络相关因素,知识表示方法从港口知识图谱中学习各外部因素的语义信息,扩散图卷积网络(DGCN)和门控循环单元(GRU)能有效挖掘港口交通流量的时空依赖特征。基于天津港交通数据集的实验结果表明,KG-DGCN-GRU能通过知识图谱和扩散图卷积有效提高预测精度,在单步预测(15 min)中与时间图卷积网络(T-GCN)和扩散卷积递归神经网络(DCRNN)相比,均方根误差(RMSE)分别降低了4.85%和7.04%,平均绝对误差(MAE)分别降低了5.80%和8.17%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    36. 面向手术导航3D/2D配准的无监督跨域迁移网络
    王熙源, 张战成, 徐少康, 张宝成, 罗晓清, 胡伏原
    《计算机应用》唯一官方网站    2024, 44 (9): 2911-2918.   DOI: 10.11772/j.issn.1001-9081.2023091332
    摘要863)   HTML3)    PDF (2025KB)(1793)    收藏

    3D/2D配准是手术导航的关键技术,现有基于深度学习的配准方法通过网络提取图像特征,继而回归出相应的姿态变换参数。此类方法依赖于真实的样本以及对应的3D标签用于训练,然而这部分专家标注的医疗数据十分稀缺。替代的方案用数字重建放射影像(DRR)图像训练网络,由于图像特征跨域的差异,在X射线图像上难以保持原有的配准精度。针对上述问题,设计基于自注意力的无监督跨域迁移网络(UCDTN),无须依赖X射线图像与其对应的3D空间标签作为训练样本,将源域所捕获的图像特征与空间变换间的对应关系迁移到目标域,借助公共特征减小域间特征的差距、降低跨域所带来的负面影响。实验结果表明,UCDTN预测结果的平均配准误差(mTRE)为2.66 mm;与未经跨域迁移训练的模型相比,mTRE指标降低了70.61%,验证了UCDTN在跨域配准任务上的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    37. 基于异步深度强化学习的车联网协作卸载策略
    赵晓焱, 韩威, 张俊娜, 袁培燕
    《计算机应用》唯一官方网站    2024, 44 (5): 1501-1510.   DOI: 10.11772/j.issn.1001-9081.2023050788
    摘要859)   HTML10)    PDF (2661KB)(1373)    收藏

    随着车联网(IoV)的快速发展,智能网联汽车产生了大量延迟敏感型和计算密集型任务,有限的车辆计算资源以及传统的云服务模式无法满足车载用户的需求,移动边缘计算(MEC)为解决海量数据的任务卸载提供了一种有效范式。但在考虑多任务、多用户场景时,由于车辆位置、任务种类以及车辆密度的实时性和动态变化,IoV中任务卸载场景复杂度较高,卸载过程中容易出现边缘资源分配不均衡、通信成本开销过大、算法收敛慢等问题。为解决以上问题,重点研究了IoV中多任务、多用户移动场景中的多边缘服务器协同任务卸载策略。首先,提出一种多边缘协同处理的三层异构网络模型,针对IoV中不断变化的环境,引入动态协作簇,将卸载问题转化为时延和能耗的联合优化问题;其次,将问题分为卸载决策和资源分配两个子问题,其中资源分配问题又拆分为面向边缘服务器和传输带宽的资源分配,并基于凸优化理论求解。为了寻求最优卸载决策集,提出一种能在协作簇中处理连续问题的多边缘协作深度确定性策略梯度(MC-DDPG)算法,并在此基础上设计了一种异步多边缘协作深度确定性策略梯度(AMC-DDPG)算法,通过将协作簇中的训练参数异步上传至云端进行全局更新,再将更新结果返回每个协作簇中提高收敛速度。仿真结果显示,AMC-DDPG算法较DDPG算法至少提高了30%的收敛速度,且在奖励和总成本等方面也取得了较好的效果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    38. 结合空间域和频域信息的双分支低光照图像增强网络
    李大海, 王忠华, 王振东
    《计算机应用》唯一官方网站    2024, 44 (7): 2175-2182.   DOI: 10.11772/j.issn.1001-9081.2023070933
    摘要843)   HTML14)    PDF (3079KB)(1176)    收藏

    针对低光照图像增强中纹理细节模糊和颜色失真的问题,从空间域和频域信息结合的角度出发,提出一个端到端的轻量级双分支网络(SAFNet)。SAFNet使用基于Transformer的空间域处理模块和频域处理模块在空间域分支和频域分支分别对图像的空间域信息和傅里叶变换后的频域信息进行处理,并通过注意力机制引导两个分支的特征进行自适应融合,得到最终增强的图像。此外,针对频域信息提出一个频域损失函数作为联合损失函数的一部分,通过联合损失函数在空间域和频域都对SAFNet进行约束。在公开数据集LOL和LSRW上进行实验,在LOL上,SAFNet在客观指标结构相似性(SSIM)和学习感知图像块相似度(LPIPS)两项指标上分别达到0.823和0.114;在LSRW上,峰值信噪比(PSNR)和SSIM分别达到17.234 dB和0.550,均优于LLFormer (Low-Light Transformer)、IAT (Illumination Adaptive Transformer)、 KinD (Kindling the Darkness)++等主流方法,且网络参数量仅为0.07×106;在DarkFace数据集上,使用SAFNet作为预处理步骤对待检测图像进行增强,可以使人脸检测平均精确率从52.6%提升至72.5%。实验结果表明,SAFNet能有效提高低光照图像的质量,并能显著改善下游任务低光照人脸检测的性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    39. 基于加强特征提取的道路病害检测算法
    龙伍丹, 彭博, 胡节, 申颖, 丁丹妮
    《计算机应用》唯一官方网站    2024, 44 (7): 2264-2270.   DOI: 10.11772/j.issn.1001-9081.2023070956
    摘要839)   HTML12)    PDF (2806KB)(668)    收藏

    针对道路病害区域小、类别数量不均衡导致检测困难的问题,提出基于YOLOv7-tiny的道路病害检测算法RDD-YOLO。首先,采用K-means++算法得到拟合目标尺寸更好的锚框。其次,在小目标检测支路上使用量化感知重参数化模块(QARepVGG),增强浅层特征提取,同时构建加强注意力模块(AM-CBAM)嵌入颈部的3个输入,抑制复杂背景干扰。然后,设计特征融合模块(Res-RFB),模拟人眼扩大感受野融合多尺度信息,提高表征能力;另外,构造轻量级解耦头(S-DeHead)提高小目标检测精确率。最后,采用归一化Wasserstein距离度量(NWD)优化小目标定位过程,并缓解样本不均衡问题。实验结果表明,与YOLOv7-tiny相比,RDD-YOLO算法在仅增加0.71×106参数量和1.7 GFLOPs计算量的成本下,mAP50提高6.19个百分点,F1-Score提高5.31个百分点,并且检测速度达到135.26 frame/s,满足道路养护工作中对检测精度和速度的需求。

    图表 | 参考文献 | 相关文章 | 多维度评价
    40. 基于改进分段卷积神经网络和知识蒸馏的学科知识实体间关系抽取
    赵宇博, 张丽萍, 闫盛, 侯敏, 高茂
    《计算机应用》唯一官方网站    2024, 44 (8): 2421-2429.   DOI: 10.11772/j.issn.1001-9081.2023081065
    摘要835)   HTML7)    PDF (2292KB)(1056)    收藏

    关系抽取是梳理学科知识的重要手段以及构建教育知识图谱的重要步骤。在当前研究中,如BERT(Bidirectional Encoder Representations from Transformers)等以Transformer架构为基础的预训练语言模型多数存在参数量大、复杂度过高的问题,难以部署于终端设备,限制了在真实教育场景中的应用。此外,大多数传统的轻量级关系抽取模型并不是通过文本结构对数据进行建模,容易忽略实体间的结构信息;且生成的词嵌入向量难以捕捉文本的上下文特征、对一词多义问题解决能力差,难以契合学科知识文本非结构化以及专有名词占比大的特点,不利于高质量的关系抽取。针对上述问题,提出一种基于改进分段卷积神经网络(PCNN)和知识蒸馏(KD)的学科知识实体间关系抽取方法。首先,利用BERT生成高质量的领域文本词向量,改进PCNN模型的输入层,从而有效捕捉文本上下文特征并在一定程度上解决一词多义问题;其次,利用卷积和分段最大池化操作深入挖掘实体间结构信息,构建BERT-PCNN模型,实现高质量的关系抽取;最后,考虑到教育场景对高效且轻量化模型的需求,蒸馏BERT-PCNN模型输出层和中间层知识,用于指导PCNN模型,完成KD-PCNN模型的构建。实验结果表明,BERT-PCNN模型的加权平均F1值达到94%,相较于R-BERT和EC_BERT模型分别提升了1和2个百分点;KD-PCNN模型的加权平均F1值达到92%,与EC_BERT模型持平;参数量相较于BERT-PCNN、KD-RB-l模型下降了3个数量级。可见,所提方法能在性能评价指标和网络参数量之间更好地权衡,有利于教育知识图谱自动化构建水平的提高和新型教育应用的研发与部署。

    图表 | 参考文献 | 相关文章 | 多维度评价
2026年 46卷 3期
刊出日期: 2026-03-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会