《计算机应用》唯一官方网站

Select

1. 大语言模型综述与展望

秦小林, 古徐, 李弟诚, 徐海文

《计算机应用》唯一官方网站 2025, 45 (3): 685-696. DOI: 10.11772/j.issn.1001-9081.2025010128

摘要（691）

HTML （58）

PDF （2035KB）（1027）

大语言模型（LLM）是由具有大量参数（通常数十亿个权重或更多）的人工神经网络组成的一类语言模型，使用自监督学习或半监督学习对大量未标记文本进行训练，是当前生成式人工智能（AI）技术的核心。与传统语言模型相比，LLM通过大量的算力、参数和数据支持，展现出更强的语言理解与生成能力，广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法，对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此，在介绍LLM的基础架构、训练技术及发展历程的基础上，分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究，进一步阐述LLM在实际应用中面临的挑战，包括数据偏差、模型幻觉和计算资源消耗等问题，并对LLM的持续发展趋势进行展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 超图应用方法综述：问题、进展与挑战

曾蠡, 杨婧如, 黄罡, 景翔, 罗超然

《计算机应用》唯一官方网站 2024, 44 (11): 3315-3326. DOI: 10.11772/j.issn.1001-9081.2023111629

摘要（641）

HTML （25）

PDF （795KB）（419）

超图是图的泛化，相较于普通图，它在复杂关系的高阶特征表达上具有显著优势。作为一种相对较新的数据结构，超图在应用领域正在发挥越来越大的作用，研究者采用超图模型及算法对现实世界中的具体问题进行建模、求解，有效地提升了解决问题的效率及质量。现有对超图的综述更多侧重于解决超图本身问题的理论及技术，缺乏对超图在具体应用场景下的建模及求解方法的归纳总结。为此，在总结介绍超图的一些基础概念后，分析了超图在各个主流应用场景下的应用方法、技术、共性问题及解决方案；通过对现有工作的归纳总结，阐述了超图运用于现实问题中仍然存在的一些问题与障碍；最后，对超图应用的未来研究方向进行了展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 知识图谱在装备故障诊断领域的研究与应用综述

武杰, 张安思, 吴茂东, 张仪宗, 王从宝

《计算机应用》唯一官方网站 2024, 44 (9): 2651-2659. DOI: 10.11772/j.issn.1001-9081.2023091280

摘要（586）

HTML （53）

PDF （2858KB）（1545）

知识图谱从装备故障诊断数据中提取有用的知识，通过（实体，关系，实体）的三元组方式，对复杂装备的故障诊断信息进行有效管理，实现装备故障的快速诊断。首先，介绍装备故障诊断知识图谱的相关概念，分析装备故障诊断领域知识图谱的构建框架；其次，归纳国内外装备故障诊断知识图谱的知识抽取、知识融合以及知识推理等几个关键技术的研究现状；最后，对目前装备故障诊断知识图谱应用进行总结，提出该领域知识图谱构建的不足和面临的挑战，并对未来装备故障诊断领域提供一些新的思路。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于改进YOLOv8的水下目标检测算法

李大海, 李冰涛, 王振东

《计算机应用》唯一官方网站 2024, 44 (11): 3610-3616. DOI: 10.11772/j.issn.1001-9081.2023111550

摘要（545）

HTML （19）

PDF （1637KB）（495）

由于水下生物的特性，水下图像中存在较多难以检测的小目标，且目标之间经常相互遮挡，而水下环境中的光线吸收和散射也会造成水下图像的颜色偏移和模糊。针对上述问题，提出水下目标检测算法WCA-YOLOv8。首先，设计特征融合模块（FFM），增强对空间维度信息的关注，提升对模糊和颜色偏移目标的识别能力；其次，加入FCA（FReLU Coordinate Attention）模块，增强对相互重叠、遮挡水下目标的特征提取能力；再次，为了提高模型对水下小目标的检测性能，将完整交并比（CIoU）损失函数替换为WIoU v3（Wise-IoU version 3）损失函数；最后，设计下采样增强模块（DEM），使特征提取过程中保存的上下文信息更完整，改善水下目标检测的性能。RUOD和URPC数据集上的实验结果表明，WCA-YOLOv8的检测平均精度均值（mAP_0.5）分别为75.8%和88.6%，检测速度分别为60 frame/s和57 frame/s。与其他前沿的水下物体检测算法相比，WCA-YOLOv8不仅能够获得更高的检测准确性，还可达到更快的检测速度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 区块链3.0的发展、技术与应用

方鹏, 赵凡, 王保全, 王轶, 蒋同海

《计算机应用》唯一官方网站 2024, 44 (12): 3647-3657. DOI: 10.11772/j.issn.1001-9081.2023121826

摘要（535）

HTML （39）

PDF （2294KB）（342）

区块链3.0是区块链技术发展的第3阶段，也是构建价值互联网的内核，它在分片、跨链以及隐私保护等方面的创新使它具有广泛的应用场景和研究价值，受到学术界和产业界相关人士的高度重视。针对区块链3.0的发展、技术与应用，调研并综述近5年国内外关于区块链3.0的相关文献。首先，介绍区块链的基本理论和技术特点，为深入了解区块链的研究进展奠定基础；其次，根据区块链技术随时间变化的演进趋势，阐述区块链3.0的发展历程和各个关键的发展时间节点，并给出以分片和侧链技术为基准点划分区块链不同的发展阶段的理由；再次，详细分析区块链3.0关键技术的研究现状，概述归纳它在物联网、医疗和农业等6大领域内的典型应用；最后，总结区块链3.0在发展过程中面临的关键性挑战和未来发展机遇。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 基于改进YOLOv5的Logo检测算法

李烨恒, 罗光圣, 苏前敏

《计算机应用》唯一官方网站 2024, 44 (8): 2580-2587. DOI: 10.11772/j.issn.1001-9081.2023081113

摘要（520）

HTML （10）

PDF （4682KB）（439）

针对Logo图像背景复杂、Logo目标尺寸多变的问题，提出了一种基于YOLOv5的改进检测算法。首先，结合CBAM（Channel Block Attention Module），分别在图像通道与空间方向进行压缩，提取图像的关键信息与重要区域；然后，使用可变空洞卷积（SAC）使网络在不同尺度下自适应地调整特征图中的感受野大小，以捕获不同尺度下的物体信息，改善网络对多尺度目标的检测效果；最后，将归一化Wasserstein距离（NWD）嵌入损失函数，将边界框建模成2D的高斯分布，计算对应的高斯分布之间的相似度，更好地度量目标之间的相似性，提高对小目标的检测性能与模型鲁棒性和稳定性。实验结果表明，在数据量较小的数据集FlickrLogos-32中，改进后算法的平均精度均值（mAP@0.5）达到90.6%，比原始YOLOv5算法提升了1个百分点；在数据量较大的数据集QMULOpenLogo中，改进后算法的mAP@0.5达到62.7%，比原始YOLOv5算法提升了2.3个百分点；在针对特定类型的Logo检测集LogoDet3K中，针对3类商标改进后算法比原始算法的mAP@0.5分别提升了1.2、1.4与1.4个百分点，说明它有更好的Logo图像小目标检测能力。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

7. 基于改进YOLOv8n的无人机视角下小目标检测算法

刘涛, 鞠事宏, 高一萌

《计算机应用》唯一官方网站 2024, 44 (11): 3603-3609. DOI: 10.11772/j.issn.1001-9081.2023111644

摘要（499）

HTML （20）

PDF （1561KB）（279）

针对目标检测算法在无人机视角下的小目标检测中精度低的问题，通过改进YOLOv8的骨干网络与注意力机制，提出一种新的小目标检测算法SFM-YOLOv8。首先，在骨干网络中融入适用于低分辨率图像和小物体检测的空间深度转换卷积（SPDConv），保留判别特征信息，提高小目标感知能力；其次，插入多分支注意力MCA（Multiple Coordinate Attention），加强提取特征层的空间信息和通道信息；然后，构建一种融合FasterNet和高效多尺度注意力（EMA）的卷积FE-C2f，减少计算量并使模型轻量化；此外，引入边界框相似度比较度量（MPDIoU）损失函数提高算法精度；最后，在YOLOv8n的网络结构中增加小目标检测层，保留更多关于小目标的位置信息和细节特征。实验结果表明，与YOLOv8n相比，SFM-YOLOv8算法在VisDrone-DET2019数据集上的平均精度均值mAP₅₀提高了4.37个百分点，参数量减少了5.98%；与相关主流模型对比，精度也有所提升，且满足实时检测需求。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

8. 非线性时间一致性的相关滤波目标跟踪

姜文涛, 李宛宣, 张晟翀

《计算机应用》唯一官方网站 2024, 44 (8): 2558-2570. DOI: 10.11772/j.issn.1001-9081.2023081121

摘要（464）

HTML （3）

PDF （7942KB）（82）

针对现有目标跟踪算法主要采用线性约束机制LADCF（Learning Adaptive Discriminative Correlation Filters）跟踪模型容易漂移的问题，提出非线性时间一致性的相关滤波目标跟踪算法。首先，结合史蒂文斯定律，提出贴近人类视觉感知特性的非线性时间一致项，使模型相对平滑地跟踪目标，从而保证跟踪连续性，避免跟踪模型漂移；其次，采用交替方向乘子法（ADMM）求解最优函数值，保证算法的跟踪实时性；最后，利用史蒂文斯定律非线性更新滤波器，使滤波器更新因子可以根据目标的变化增强和抑制滤波器，以适应目标变化，防止滤波器退化。在4个标准数据集上与主流相关滤波和深度学习算法对比实验，相较于基线算法LADCF，所提算法的跟踪精确度和成功率在OTB100数据集上分别提升了2.4和3.8个百分点；在UAV123上分别提升了1.5和2.5个百分点。实验结果表明，所提算法能有效避免跟踪模型漂移，降低滤波器退化概率，跟踪精确度和成功率较高，面对遮挡、光照变化等复杂场景时具有较强的鲁棒性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

9. 融合1D-CNN与BiGRU的类不平衡流量异常检测

陈虹, 齐兵, 金海波, 武聪, 张立昂

《计算机应用》唯一官方网站 2024, 44 (8): 2493-2499. DOI: 10.11772/j.issn.1001-9081.2023081112

摘要（424）

HTML （4）

PDF （1194KB）（1264）

网络流量异常检测是利用各种检测技术分析判断网络流量，发现网络中潜在的攻击，是一种有效的网络安全防护方法。针对高维海量数据和不同攻击类别的网络流量数据不均衡而导致检测准确率低、误报率高的问题，提出一种融合一维卷积神经网络（1D-CNN）和双向门控循环单元（BiGRU）的类不平衡流量异常检测模型。首先，针对类不平衡数据，通过使用改进的合成少数类过采样技术（SMOTE）即Borderline-SMOTE和基于高斯混合模型（GMM）的欠采样聚类技术进行平衡处理；然后，使用1D-CNN提取数据的局部特征，并利用BiGRU更好地提取数据中的时序特征；最后，在UNSW-NB15数据集对所提模型进行验证，所提模型的准确率为98.12%，误报率为1.28%。结果表明，所提模型提高了对少数攻击的识别率，检测精度高于其他经典机器学习和深度学习模型。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

10. 基于语音和文本的双模态情感识别综述

韩令敏, 陈仙红, 熊文梦

《计算机应用》唯一官方网站 2025, 45 (4): 1025-1034. DOI: 10.11772/j.issn.1001-9081.2024030319

摘要（420）

HTML （62）

PDF （1625KB）（1597）

情感识别是一种让计算机识别和理解人类情感的技术，在众多领域都起着重要的作用，也是人工智能领域重要的发展方向。因此，梳理与归纳基于语音和文本的双模态情感识别的研究现状：首先，分类阐述情感表示空间；其次，按照情感数据库的情感表示空间对这些数据库进行分类，并总结常见的多模态情感数据库；再次，介绍基于语音和文本的双模态情感识别方法，包括特征提取、模态融合和决策分类，重点介绍模态融合方法并将这些方法分为特征级融合、决策级融合、模型级融合和多层次融合这4类；此外，比较和分析一系列语音和文本双模态情感识别方法的结果；最后，介绍情感识别的应用场景、面临的挑战与未来的发展方向。以上旨在对多模态情感识别，尤其是对基于语音和文本的双模态情感识别的相关工作进行分析与总结，并为情感识别提供有价值的参考。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

11. 基于双流神经网络的个性化联邦学习方法

沈哲远, 杨珂珂, 李京

《计算机应用》唯一官方网站 2024, 44 (8): 2319-2325. DOI: 10.11772/j.issn.1001-9081.2023081207

摘要（414）

HTML （54）

PDF （2185KB）（542）

经典的联邦学习（FL）算法在数据高度异构的场景下难以取得较好的效果。个性化联邦学习（PFL）针对数据异构问题，提出新的解决方案，即为每个客户端“量身定做”专属模型，这样模型会拥有较好的性能；然而同时会引出难以将FL扩展到新客户端上的问题。针对PFL中的性能与扩展的难题展开研究，提出基于双流神经网络结构的联邦学习模型，简称FedDual。双流神经网络模型通过增加一个用于分析客户端个性化特征的编码器，既能拥有个性化模型的性能，又便于扩展到新客户端。实验结果表明，相较于经典联邦平均（FedAvg）算法，FedDual在MNIST和FashionMNIST等数据集上的准确率有明显提升，而在CIFAR10数据集上的准确率提升了10个百分点以上，且面对新客户端保持准确率不下降，实现了“即插即用”，解决了新客户端难以扩展的问题。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

12. 基于轨迹预测和分布式MADDPG的无人机集群追击决策

王昱, 关智慧, 李远鹏

《计算机应用》唯一官方网站 2024, 44 (11): 3623-3628. DOI: 10.11772/j.issn.1001-9081.2023101538

摘要（394）

HTML （5）

PDF （918KB）（127）

针对复杂任务环境下无人机（UAV）集群追击决策算法灵活性不足、泛化能力差等问题，提出一种基于轨迹预测的分布式多智能体深度确定性策略梯度（TP-DMADDPG）算法。首先，为增强追击任务的真实性，为目标机设计智能化逃逸策略；其次，考虑到因通信中断等原因导致的目标机信息缺失等情况，采用长短时记忆（LSTM）网络实时预测目标机的位置信息，并基于预测信息构建决策模型的状态空间；最后，依据分布式框架和多智能体深度确定性策略梯度（MADDPG）算法设计TP-DMADDPG算法，增强复杂空战进程中集群追击决策的灵活性和泛化能力。仿真实验结果表明，相较于深度确定性策略梯度（DDPG）、双延迟深度确定性策略梯度（TD3）和MADDPG算法，TP?DMADDPG算法将协同决策的成功率提升了至少15个百分点，能够解决不完备信息下追击智能化逃逸目标机的问题。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

13. 基于裁剪优化和策略指导的近端策略优化算法

周毅, 高华, 田永谌

《计算机应用》唯一官方网站 2024, 44 (8): 2334-2341. DOI: 10.11772/j.issn.1001-9081.2023081079

摘要（392）

HTML （15）

PDF （3877KB）（692）

针对近端策略优化（PPO）算法难以严格约束新旧策略的差异和探索与利用效率较低这2个问题，提出一种基于裁剪优化和策略指导的PPO（COAPG-PPO）算法。首先，通过分析PPO的裁剪机制，设计基于Wasserstein距离的信任域裁剪方案，加强对新旧策略差异的约束；其次，在策略更新过程中，融入模拟退火和贪心算法的思想，提升算法的探索效率和学习速度。为了验证所提算法的有效性，使用MuJoCo测试基准对COAPG-PPO与CO-PPO（PPO based on Clipping Optimization）、PPO-CMA（PPO with Covariance Matrix Adaptation）、TR-PPO-RB（Trust Region-based PPO with RollBack）和PPO算法进行对比实验。实验结果表明，COAPG-PPO算法在大多数环境中具有更严格的约束能力、更高的探索和利用效率，以及更高的奖励值。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

14. 基于深度强化学习的多机器人路径跟随与编队

何浩东, 符浩, 王强, 周帅, 刘伟

《计算机应用》唯一官方网站 2024, 44 (8): 2626-2633. DOI: 10.11772/j.issn.1001-9081.2023081120

摘要（376）

HTML （9）

PDF （3411KB）（584）

针对多机器人在人群环境中路径跟随与编队的避障及运动轨迹平滑性问题，提出基于深度强化学习的多机器人路径跟随与编队算法。首先，建立行人危险性优先级机制，结合行人危险性优先级机制与强化学习设计危险意识网络，提高多机器人编队的安全性；然后，引入虚拟机器人作为多机器人的跟随目标，将路径跟随转化为多机器人对虚拟机器人的跟随控制，提高机器人运动轨迹的平滑性；最后，通过仿真实验将所提算法与现有算法进行对比，同时进行定量与定性分析。实验结果表明，与现有点对点的路径跟随算法相比，所提算法在人群环境下具有优异的避障性能，可保证多机器人运动轨迹的平滑性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

15. 课程学习指导下的半监督目标检测框架

张英俊, 李牛牛, 谢斌红, 张睿, 陆望东

《计算机应用》唯一官方网站 2024, 44 (8): 2326-2333. DOI: 10.11772/j.issn.1001-9081.2023081062

摘要（363）

HTML （26）

PDF （2042KB）（542）

为了提高伪标签的质量，解决半监督目标检测（SSOD）中的确认偏差问题，并针对现有算法中忽视无标注数据复杂性导致错误伪标签的难点，提出一种课程学习（CL）指导下的SSOD框架，该框架主要由ICSD（IoU-Confidence-Standard-Deviation）难度测量器和BP（Batch-Package）训练调度器这2个模块组成。其中，ICSD难度测量器综合考虑了伪边界框之间的交并比（IoU）、置信度、类别标签等信息，并引入C_IOU（Checkpoint_IOU）方法评估无标注数据的可靠性；BP训练调度器设计2种高效调度策略，分别从Batch和Package角度出发，优先选择可靠性指标高的无标记数据，实现以CL的方式充分利用整个无标记数据集。在Pascal VOC和MS-COCO数据集上的广泛对比实验结果表明，所提框架不仅适用于现有的SSOD算法，而且检测精度和稳定性都得到显著提升。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

16. 应对零日攻击的混合车联网入侵检测系统

方介泼, 陶重犇

《计算机应用》唯一官方网站 2024, 44 (9): 2763-2769. DOI: 10.11772/j.issn.1001-9081.2023091328

摘要（361）

HTML （14）

PDF （2618KB）（1650）

现有机器学习方法在面对零日攻击检测时，存在对样本数据过度依赖以及对异常数据不敏感的问题，从而导致入侵检测系统（IDS）难以有效防御零日攻击。因此，提出一种基于Transformer和自适应模糊神经网络推理系统（ANFIS）的混合车联网入侵检测系统。首先，设计了一种数据增强算法，通过先去除噪声再生成的方法解决了数据样本不平衡的问题；其次，将非线性特征交互引入复杂的特征组合，设计了一个特征工程模块；最后，将Transformer的自注意力机制和ANFIS的自适应学习方法相结合，以提高特征表征能力，减少对样本数据的依赖。在CICIDS-2017和UNSW-NB15入侵数据集上将所提系统与Dual-IDS等先进（SOTA）算法进行比较。实验结果表明，对于零日攻击，所提系统在CICIDS-2017入侵数据集上实现了98.64%的检测精确率和98.31%的F1值，在UNSW-NB15入侵数据集上实现了93.07%的检测精确率和92.43%的F1值，验证了所提算法在零日攻击检测方面的高准确性和强泛化能力。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

17. 基于改进实时检测Transformer的塔机上俯视场景小目标检测模型

庞玉东, 李志星, 刘伟杰, 李天昊, 王宁宁

《计算机应用》唯一官方网站 2024, 44 (12): 3922-3929. DOI: 10.11772/j.issn.1001-9081.2023121796

摘要（361）

HTML （10）

PDF （3128KB）（262）

针对塔机吊钩相互碰撞导致物体跌落以及塔机倒塌致使人员伤亡等一系列施工现场人员安全保障的问题，提出一种基于改进实时检测Transformer （Real-Time DEtection TRansformer， RT-DETR）的塔机上俯视场景小目标检测模型。首先，在原始模型中加入应用模型的重参数化思想设计的多路训练和单路推理结构以提升检测速度；其次，重新设计FasterNet Block中的卷积模块替换原始BackBone之中的BasicBlock以提升检测模型性能；再次，利用新的损失函数Inner-SIoU（Inner-Structured Intersection over Union）进一步提升模型精度与收敛速度；最后，进行消融实验与对比实验验证模型性能。结果表明，在检测塔机顶部俯视小目标图像时，所提模型的精度达到94.7%，高于原始RT-DETR模型6.1个百分点；所提模型的每秒检测帧数（FPS）达到59.7，检测速度相较于原模型提升了21%。在公共数据集COCO 2017上所提模型的平均精度（AP）比YOLOv5、YOLOv7和YOLOv8分别高2.4、1.5和1.3个百分点。可见所提模型满足塔机上俯视场景下的小目标检测精度和速度的要求。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

18. 基于 YOLO v8的轻量化安全帽佩戴检测算法

冯勇, 杨思卓, 徐红艳

《计算机应用》唯一官方网站 0, (): 251-256. DOI: 10.11772/j.issn.1001-9081.2024010020

摘要（355）

HTML （0）

PDF （2164KB）（808）

PDF（mobile）（1480KB）（22）

建筑、采矿、勘探等行业对生产环节的安全帽佩戴有着强制性规定，安全帽佩戴检测算法在上述行业得到广泛应用，然而现有算法存在参数量大、复杂度高及实时性差等问题。因此，提出一种基于YOLO v8的轻量化安全帽佩戴检测算法——YOLO v8-s-LE。首先设计了轻量化自适应权重下采样（LAD）方法，相较于原始YOLO v8算法，该算法的参数量和浮点运算量显著下降；然后使用高效多尺度卷积C2f_EMC（C2f_Efficient Multi-scale Conv）方法提取多尺度特征信息，从而有效增加了网络深度，使神经网络兼顾了浅层和深层语义信息，并进一步提高了算法对特征信息的表达能力。在公开数据集SHWD （Safety Helmet Wearing Dataset）上与YOLO v8-s算法对比的实验结果表明，所提算法的参数量减少了77%，浮点运算量下降了73%，精确率达到92.6%，兼顾准确性和实时性要求，更适用于实际生产环境的部署与应用。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

19. 基于解耦注意力机制的多变量时序预测模型

李力铤, 华蓓, 贺若舟, 徐况

《计算机应用》唯一官方网站 2024, 44 (9): 2732-2738. DOI: 10.11772/j.issn.1001-9081.2023091301

摘要（353）

HTML （11）

PDF （1545KB）（1423）

针对多变量时序预测难以充分利用序列上下文语义信息及变量间隐含关联信息的问题，提出一种基于解耦注意力机制的多变量时序预测模型Decformer。首先，提出一种解耦注意力机制，从而充分利用嵌入的语义信息提升注意力权值分配的准确度；其次，提出一种不依赖于显式变量关系的模式关联挖掘方法，以挖掘并利用变量间隐含的模式关联信息。在话务量、电力消耗和交通3种不同类型的真实数据集（TTV、ECL和PeMS-Bay）上，与长短期时间序列网络（LSTNet）、Transformer、FEDformer等优秀的开源多变量时序预测模型相比，Decformer在所有预测时间长度上都取得了最高的预测精度。相较于LSTNet，Decformer在TTV、ECL和PeMS-Bay数据集上的平均绝对误差（MAE）分别降低了17.73%~27.32%、10.89%~17.01%和13.03%~19.64%；均方误差（MSE）分别降低了23.53%~58.96%、16.36%~23.56%和15.91%~26.30%。实验结果表明，Decformer能够有效提升多变量时序预测的精度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

20. 面向图神经网络模型提取攻击的图数据生成方法

杨莹, 郝晓燕, 于丹, 马垚, 陈永乐

《计算机应用》唯一官方网站 2024, 44 (8): 2483-2492. DOI: 10.11772/j.issn.1001-9081.2023081110

摘要（347）

HTML （3）

PDF （3213KB）（339）

无数据模型提取攻击是基于攻击者在进行攻击时所需的训练数据信息未知的情况下提出的一类机器学习安全问题。针对无数据模型提取攻击在图神经网络（GNN）领域的研究缺乏，提出分别用GNN可解释性方法GNNExplainer和图数据增强方法GAUG-M优化图节点特征信息和边信息生成所需图数据，最终提取GNN模型的方法。首先，利用GNNExplainer方法对目标模型的响应结果进行可解释性分析得到重要的图节点特征信息；其次，通过对重要的图节点特征加权，对非重要图节点特征降权，实现图节点特征信息的整体优化；然后，使用图形自动编码器作为边信息预测模块，根据优化后的图节点特征得到节点与节点之间的连接概率；最后，根据概率增加或者删减相应边优化边信息。实验采用5个图数据集训练的3种GNN模型架构作为目标模型提取攻击，得到的替代模型达到了73%~87%的节点分类任务准确性和76%~89%的与目标模型性能的一致性，验证了所提方法的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

21. 面向手术导航3D/2D配准的无监督跨域迁移网络

王熙源, 张战成, 徐少康, 张宝成, 罗晓清, 胡伏原

《计算机应用》唯一官方网站 2024, 44 (9): 2911-2918. DOI: 10.11772/j.issn.1001-9081.2023091332

摘要（346）

HTML （3）

PDF （2025KB）（1123）

3D/2D配准是手术导航的关键技术，现有基于深度学习的配准方法通过网络提取图像特征，继而回归出相应的姿态变换参数。此类方法依赖于真实的样本以及对应的3D标签用于训练，然而这部分专家标注的医疗数据十分稀缺。替代的方案用数字重建放射影像（DRR）图像训练网络，由于图像特征跨域的差异，在X射线图像上难以保持原有的配准精度。针对上述问题，设计基于自注意力的无监督跨域迁移网络（UCDTN），无须依赖X射线图像与其对应的3D空间标签作为训练样本，将源域所捕获的图像特征与空间变换间的对应关系迁移到目标域，借助公共特征减小域间特征的差距、降低跨域所带来的负面影响。实验结果表明，UCDTN预测结果的平均配准误差（mTRE）为2.66 mm；与未经跨域迁移训练的模型相比，mTRE指标降低了70.61%，验证了UCDTN在跨域配准任务上的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

22. 基于自注意力融合的不完整多视图聚类算法

李顺勇, 李师毅, 胥瑞, 赵兴旺

《计算机应用》唯一官方网站 2024, 44 (9): 2696-2703. DOI: 10.11772/j.issn.1001-9081.2023091253

摘要（341）

HTML （9）

PDF （2806KB）（1187）

基于不完整数据的多视图聚类任务已经成为无监督学习领域的研究热点之一。然而大多数基于“浅层”模型的多视图聚类算法通常在面对大规模高维数据时难以提取和刻画视图内的潜在特征结构；同时，堆叠或求平均的多视图信息融合方式忽视了视图之间的差异性，没有充分考虑各视图对构建公共一致表示的不同贡献。针对以上问题，提出一种基于自注意力融合的不完整多视图聚类算法（IMVCSAF）。首先，基于深度自编码器提取各视图的潜在特征，并采用对比学习的方式最大化各视图间的一致性信息；其次，采用自注意力机制对各视图的潜在表示进行重新编码和融合，并全面考虑和挖掘不同视图之间的内在因果性和特征互补性；再次，基于公共一致表示对缺失实例样本的潜在表示进行预测和恢复，从而完整地实现多视图聚类的过程。在Scene-15、LandUse-21、Caltech101-20和Noisy-MNIST数据集上的实验结果表明，IMVCSAF在满足收敛性要求的前提下得到的准确率均高于其他对比算法，而在50%缺失率的Noisy-MNIST数据集上，IMVCSAF的准确率比次优的COMPLETER（inCOMPlete muLti-view clustEring via conTrastivE pRediction）算法提高了6.58个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

23. APK-CNN和Transformer增强的多域虚假新闻检测模型

李金金, 桑国明, 张益嘉

《计算机应用》唯一官方网站 2024, 44 (9): 2674-2682. DOI: 10.11772/j.issn.1001-9081.2023091359

摘要（338）

HTML （17）

PDF （1378KB）（1520）

为解决社交媒体新闻中的领域转移、领域标签不完整问题，以及探索更高效的多域新闻文本特征提取和融合网络，提出一种基于APK-CNN（Adaptive Pooling Kernel Convolutional Neural Network）和Transformer增强的多域虚假新闻检测模型Transm3。首先，设计三通道网络对文本的语义、情感和风格信息进行特征提取和表示，并利用多粒度跨域交互器对这些特征进行视图组合；其次，通过优化的软共享内存网络和域适配器来完善新闻领域标签；再次，将Transformer与多粒度跨域交互器结合，使用更先进的融合网络动态加权聚合不同领域的交互特征；最后，将融合特征输入分类器中用于真/假新闻判别。实验结果表明，Transm3与M³FEND（Memory-guided Multi-view Multi-domain FakE News Detection）和EANN（Event Adversarial Neural Networks for multi-modal fake news detection）相比，综合F1值在中文数据集上分别提高了3.68%和6.46%，在英文数据集上分别提高了6.75%和11.93%，在各分领域上F1值也有明显的提高，充分验证了Transm3在多域虚假新闻检测工作上的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

24. 改进掩码自编码器的工业缺陷检测方法

邓凯丽, 魏伟波, 潘振宽

《计算机应用》唯一官方网站 2024, 44 (8): 2595-2603. DOI: 10.11772/j.issn.1001-9081.2023081122

摘要（335）

HTML （10）

PDF （4261KB）（31）

针对目前只需正常样本即可实现缺陷检测的方法存在漏检或过度检测的问题，构建一种改进掩码自编码器与改进Unet结合的方法实现像素级缺陷检测。首先，采用拟合缺陷模块生成缺陷掩码图像及正常图像对应的缺陷图像；其次，对缺陷图像随机掩码，去除缺陷图像大部分的缺陷信息，激励Transformer结构的自编码器从未掩码的正常区域学习表示并依据上下文修复缺陷图像，为了提高模型对细节的修复能力，设计了新的损失函数；最后，将缺陷图像与修复图像拼接后输入拥有通道方向交叉融合Transformer结构的Unet，实现像素级缺陷检测。实验结果表明，在MVTec AD数据集上，所提方法平均的基于图像的和基于像素的接受者操作特征曲线下的面积值（ROC AUC）分别达到了0.984和0.982，与DRAEM（Discriminatively trained Reconstruction Anomaly Embedding Model）相比分别提高了2.9和3.2个百分点；与CFLOW-AD（Anomaly Detection via Conditional normalizing FLOWs）相比分别提高了3.1和0.8个百分点，证明所提方法具有较高的识别率和检测精度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

25. 基于注意力机制和多尺度融合的 U- Net改进算法

吴淞, 蓝鑫, 单靖杨, 徐海文

《计算机应用》唯一官方网站 0, (): 24-28. DOI: 10.11772/j.issn.1001-9081.2022121844

摘要（333）

HTML （6）

PDF （2163KB）（130）

针对原始U-Net在医学图像分割任务中计算冗余和难以划分细小结构等问题，提出一种基于注意力机制和多尺度融合的U-Net改进算法。首先，通过在跳跃路径上引入通道注意力机制，网络关注包含更重要信息的通道，从而减少计算资源开销，并提升计算效率；其次，增加特征融合策略为传递给解码器的特征图增加上下文信息，从而实现特征之间的互补和多重利用；最后，使用Dice损失和二元交叉熵损失进行联合优化，以应对细小结构分割时可能出现的损失函数剧烈振荡问题。在Kvasir_seg和DRIVE数据集上进行的实验验证的结果表明，与原始U-Net算法相比，所提改进算法的Dice系数分别提高了1.81和0.82个百分点，灵敏度（SE）分别提高了1.94和3.53个百分点，准确度（Acc）分别提高了1.62和0.04个百分点。可见，所提改进算法能够提升原始U-Net对于细小结构分割的性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

26. 基于自适应阈值学习的时序因果推断方法

赵秦壮, 谭红叶

《计算机应用》唯一官方网站 2024, 44 (9): 2660-2666. DOI: 10.11772/j.issn.1001-9081.2023091278

摘要（331）

HTML （27）

PDF （1142KB）（195）

时序数据存在近因性特点，即变量值普遍依赖近期的历史信息，而现有时序因果推断方法没有充分考虑时序数据的这种特性，在通过假设检验推断不同延迟的因果关系时使用统一的阈值，难以有效推断较弱的因果关系。针对上述问题，提出基于自适应阈值学习的时序因果推断方法：首先提取数据特性，其次根据不同延迟下数据呈现的性质，自动地学习假设检验过程中使用的阈值组合，最后将该阈值组合用于PC（Peter-Clark）算法、PCMCI（Peter-Clark and Momentary Conditional Independence）算法和VAR-LINGAM（Vector AutoRegressive LINear non-Gaussian Acyclic Model）算法的假设检验过程，以得到更准确的因果关系结构。在仿真数据集上的实验结果表明，采用所提方法的自适应PC算法、自适应PCMCI算法和自适应VAR-LINGAM算法的F1值都有所提高。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

27. 基于需求模式自适应匹配的间歇性需求预测方法

范黎林, 曹富康, 王琬婷, 杨凯, 宋钊瑜

《计算机应用》唯一官方网站 2024, 44 (9): 2747-2755. DOI: 10.11772/j.issn.1001-9081.2023091372

摘要（314）

HTML （4）

PDF （1955KB）（504）

大型制造企业售后配件的需求分布稀疏、波动性大，需求频率和需求数量不确定性较高，序列呈现出典型的间歇性特点。在实际运维中，配件需求在频率和数量方面存在较大波动，从而产生变化多样的需求模式，而现有间歇性需求预测主要采用单一或静态组合的固定预测模型，难以充分挖掘不同需求模式下需求序列的演化规律，预测精度和稳定性均难以保证。为解决上述问题，提出一种基于需求模式自适应匹配的间歇性需求预测方法，通过动态识别和匹配需求模式提升间歇性序列预测效果。该方法包括两个阶段：在模型训练阶段，首先，根据配件历史需求数据的间歇性特征，将它划分为需求量序列和间隔量序列，并对两类序列分别进行聚类，以捕获每类序列对应的不同需求和间隔模式；其次，建立包含统计学分析模型、浅层机器学习模型及深度学习模型的预测模型库，测试各模型对每种需求模式的预测效果，识别并标记每类需求模式的最优预测模型。在预测阶段，将待预测序列划分为需求量序列和间隔量序列，确定需求模式并匹配最佳预测模型，进而将需求量和间隔量的预测值合并，形成最终预测结果。在美国汽车公司和英国空军的间歇性配件需求数据集上的实验结果表明，所提方法可适用于不同需求模式的配件历史数据，通过自适应匹配需求模式和最优预测模型，有效提升了预测精度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

28. 基于区块链的动态密文排序检索方案

孙晓玲, 王丹辉, 李姗姗

《计算机应用》唯一官方网站 2024, 44 (8): 2500-2505. DOI: 10.11772/j.issn.1001-9081.2023081114

摘要（312）

HTML （6）

PDF （1741KB）（107）

为解决云存储服务器不可信问题，提出基于区块链的动态密文排序检索方案。首先，采用树形索引结构，可达到亚线性的检索效率；使用向量空间模型，降低了文本的复杂度；其次，利用词频-逆文档频率（TF-IDF）加权统计算法实现了多关键词检索结果的排序；再次，采用为新添加的文件单独建立索引树、为删除文件建立删除列表的方法，动态更新区块链上可搜索加密方案；最后，通过泄漏函数证明了所提方案对自适应选择关键词攻击的安全性。性能测试结果表明，所提方案采用的树形索引结构相较于｛key，value｝索引结构，索引树生成时间平均降低了98%、文件搜索时间平均降低了7%、动态更新时间平均降低了99%，各阶段效率均有明显提高。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

29. 基于图共现增强多层感知机的会话推荐

唐廷杰, 黄佳进, 秦进, 陆辉

《计算机应用》唯一官方网站 2024, 44 (8): 2357-2364. DOI: 10.11772/j.issn.1001-9081.2023081063

摘要（305）

HTML （11）

PDF （1743KB）（170）

针对多层感知机（MLP）架构无法捕获会话序列上下文中的共现关系的问题，提出了一种基于图共现增强MLP的会话推荐模型GCE-MLP。首先，利用MLP架构捕获会话序列的顺序依赖关系，同时通过共现关系学习层获得序列上下文中的共现关系，并通过信息融合模块得到会话表示；其次，设计了特定的特征选择层，旨在扩大不同关系学习层输入特征的差异性；最后，通过噪声对比任务最大化两种关系表征之间的互信息，进一步增强对会话兴趣的表征学习。在多个真实数据集上的实验结果表明GCE-MLP的推荐性能优于目前主流的模型，验证了该模型的有效性。与最优的MLP架构模型FMLP-Rec（Filter-enhanced MLP for Recommendation）相比，在Diginetica数据集上，P@20最高达到了54.08%，MRR@20最高达到了18.87%，分别提升了2.14和1.43个百分点；在Yoochoose数据集上，P@20最高达到了71.77%，MRR@20最高达到了31.78%，分别提升了0.48和1.77个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

30. 多无人机编队避障和编队重构方法

穆凌霞, 周政君, 王斑, 张友民, 薛向宏, 宁凯凯

《计算机应用》唯一官方网站 2024, 44 (9): 2938-2946. DOI: 10.11772/j.issn.1001-9081.2023091342

摘要（304）

HTML （9）

PDF （5293KB）（385）

针对多无人机（UAV）编队飞行过程中的避障和故障问题，提出一种编队动态变换与重构方法。编队内UAV将障碍物和其余UAV作为动态威胁，根据当前飞行环境自适应地改变航迹评价函数的得分权重，提高编队在动态环境下的避障能力；当编队中某一UAV故障时，对剩余UAV进行编队队形重构，改变动态窗口法（DWA）目标函数中僚机相对于长机的位置，实时调整得到新的编队，从而实现容错编队飞行。仿真实验结果表明，所提编队避障和重构方法能够实现动态避障以及单机故障或动力不足情况下的容错编队飞行；与传统DWA相比，所得到的编队无人机间距离误差更小。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

31. 基于改进分段卷积神经网络和知识蒸馏的学科知识实体间关系抽取

赵宇博, 张丽萍, 闫盛, 侯敏, 高茂

《计算机应用》唯一官方网站 2024, 44 (8): 2421-2429. DOI: 10.11772/j.issn.1001-9081.2023081065

摘要（303）

HTML （6）

PDF （2292KB）（1014）

关系抽取是梳理学科知识的重要手段以及构建教育知识图谱的重要步骤。在当前研究中，如BERT（Bidirectional Encoder Representations from Transformers）等以Transformer架构为基础的预训练语言模型多数存在参数量大、复杂度过高的问题，难以部署于终端设备，限制了在真实教育场景中的应用。此外，大多数传统的轻量级关系抽取模型并不是通过文本结构对数据进行建模，容易忽略实体间的结构信息；且生成的词嵌入向量难以捕捉文本的上下文特征、对一词多义问题解决能力差，难以契合学科知识文本非结构化以及专有名词占比大的特点，不利于高质量的关系抽取。针对上述问题，提出一种基于改进分段卷积神经网络（PCNN）和知识蒸馏（KD）的学科知识实体间关系抽取方法。首先，利用BERT生成高质量的领域文本词向量，改进PCNN模型的输入层，从而有效捕捉文本上下文特征并在一定程度上解决一词多义问题；其次，利用卷积和分段最大池化操作深入挖掘实体间结构信息，构建BERT-PCNN模型，实现高质量的关系抽取；最后，考虑到教育场景对高效且轻量化模型的需求，蒸馏BERT-PCNN模型输出层和中间层知识，用于指导PCNN模型，完成KD-PCNN模型的构建。实验结果表明，BERT-PCNN模型的加权平均F1值达到94%，相较于R-BERT和EC_BERT模型分别提升了1和2个百分点；KD-PCNN模型的加权平均F1值达到92%，与EC_BERT模型持平；参数量相较于BERT-PCNN、KD-RB-l模型下降了3个数量级。可见，所提方法能在性能评价指标和网络参数量之间更好地权衡，有利于教育知识图谱自动化构建水平的提高和新型教育应用的研发与部署。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

32. 结合自我特征和对比学习的推荐模型

杨兴耀, 陈羽, 于炯, 张祖莲, 陈嘉颖, 王东晓

《计算机应用》唯一官方网站 2024, 44 (9): 2704-2710. DOI: 10.11772/j.issn.1001-9081.2023091264

摘要（302）

HTML （12）

PDF （1737KB）（536）

针对图神经网络推荐中图卷积在消息传递过程的嵌入表示过平滑和噪声问题，提出一种结合自我特征和对比学习的推荐模型（SfCLRec）。采用预训练-正式训练架构训练模型，首先预训练用户和项目的嵌入表示，通过融合节点自我特征维持节点本身的特征唯一性，并引入层级对比学习任务减少来自高阶邻居节点中的噪声；其次，在正式训练阶段根据评分机制重新构建协同图邻接矩阵；最后，根据最终嵌入得到预测评分。实验结果表明，相较于LightGCN、SimGCL（Simple Graph Contrastive Learning）等现有图神经网络推荐模型，SfCLRec在3个公开数据集ML-latest-small、Last.FM和Yelp中均取得了较好的召回率和归一化折损累计增益（NDCG），验证了SfCLRec的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

33. 面向学生课堂情感计算的自适应混合网络

戎妍, 刘嘉雯, 李馨蕾

《计算机应用》唯一官方网站 2024, 44 (9): 2919-2930. DOI: 10.11772/j.issn.1001-9081.2023091303

摘要（302）

HTML （5）

PDF （4730KB）（1124）

情感计算可以为智慧教育提供更好的教学效果和学习体验。目前针对课堂领域的情感计算研究仍存在有限的适应性与对复杂场景的感知能力较弱的问题。针对这一挑战，提出一种混合架构SC-ACNet，旨在对学生课堂进行准确的情感计算。该架构包含一个能适应小目标的多尺度学生面部检测模块；一个能适应不同面部姿态的、具有自适应空间结构的情感计算模块，对学生的5种课堂情感（平静、困惑、愉悦、困倦和惊讶）进行准确识别；以及一个自注意力模块，以可视化模型中对结果产生主要贡献的区域。此外，为缓解课堂环境下学生面部情绪图像数据集匮乏的问题，构建了一个学生课堂数据集SC-ACD。在SC-ACD数据集上的实验结果表明，与基线方法YOLOv7相比，SC-ACNet的平均精度均值（mAP）提升了4.2个百分点，情感计算准确率提升了9.1个百分点；此外，SC-ACNet在KDEF和RaFD数据集上的准确率分别达到了0.972和0.994，验证了SC-ACNet可作为提高智慧课堂教学质量的有前途的解决方案。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

34. 神经架构搜索综述

孙仁科, 皇甫志宇, 陈虎, 李仲年, 许新征

《计算机应用》唯一官方网站 2024, 44 (10): 2983-2994. DOI: 10.11772/j.issn.1001-9081.2023101374

摘要（299）

HTML （32）

PDF （3686KB）（562）

近几年，深度学习因具有强大的表征能力，已经在许多领域中取得了突破性的进展，而神经网络的架构对它的性能至关重要。然而，高性能的神经网络架构设计严重依赖研究人员的先验知识和经验，神经网络参数量庞大，难以设计最优的神经网络架构，因此自动神经架构搜索（NAS）获得了极大的关注。NAS是一种使用机器学习的方法，可以在不需要大量人力的情况下，自动搜索最优网络架构的技术，是未来神经网络设计的重要手段之一。NAS本质上是一个搜索优化问题，通过对搜索空间、搜索策略和性能评估策略的设计，自动搜索最优的网络结构。从搜索空间、搜索策略和性能评估策略这3个方面详细且全面地分析、比较和总结目前NAS的研究进展，方便读者快速了解神经架构搜索的发展过程和各项技术的优缺点，并提出NAS未来可能的研究发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

35. 社交媒体数据中水灾事件求助信息提取模型

孙焕良, 王思懿, 刘俊岭, 许景科

《计算机应用》唯一官方网站 2024, 44 (8): 2437-2445. DOI: 10.11772/j.issn.1001-9081.2023081080

摘要（298）

HTML （4）

PDF （2708KB）（329）

由于社交媒体平台上所发布的非结构化信息存在数据不一致、重要程度不同等问题，使自动准确抽取所需信息并标注受灾级别成为一个有挑战性的工作。因此，结合形式概念分析（FCA）、词共现关系和上下文语义信息构建了水灾事件知识体系。利用所构建的知识体系，基于TencentPretrain框架对大规模语言预训练模型（LLM）进行指令微调，构建了ChatFlowFlood信息抽取模型，可以在少量人工标记情况下，准确自动抽取被困情况、紧缺物资等信息；在信息抽取模型的基础上，通过模糊层次分析法（FAHP）和CRITIC法（CRiteria Importance Through Intercriteria Correlation）主客观结合评定求助信息的救援优先级，帮助决策者理解灾情紧急程度。实验结果表明，在中文社交媒体数据上，与ChatFlow-7B模型相比，ChatFlowFlood模型的F_BERT指标提升了73.09%。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

36. 基于多域特征提取的多变量时间序列异常检测

赵培, 乔焰, 胡荣耀, 袁新宇, 李敏悦, 张本初

《计算机应用》唯一官方网站 2024, 44 (11): 3419-3426. DOI: 10.11772/j.issn.1001-9081.2023111636

摘要（297）

HTML （4）

PDF （754KB）（1878）

PDF（mobile）（1807KB）（24）

多变量时间序列（MTS）数据具有高维性，且分布复杂多变，现有的异常检测模型在面对MTS数据集时普遍存在误判率高、训练困难等问题，且多数模型仅考虑时间序列样本的时空特征，对时间序列特征的学习并不全面。为了解决以上问题，提出一种基于多域特征提取的MTS异常检测模型（MFE-TS）。首先，从原始数据域出发，使用长短期记忆（LSTM）网络与卷积神经网络（CNN）分别提取MTS的时间相关性和空间相关性特征。其次，用傅里叶变换将原始时间序列转换到频域空间，并利用Transformer学习数据在频域空间的幅度与相位特征。多域特征学习能更全面地建模时间序列特征，从而提高模型对MTS的异常检测性能。此外，引入掩码策略，进一步增强模型的特征学习能力，并使模型具备一定的抗噪性。实验结果表明，MFE-TS在多个真实MTS数据集上展现了优越的性能，同时在含有噪声的数据集中仍能保持较好的检测效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

37. 基于多尺度记忆库的像素级无监督工业异常检测

刘永江, 陈斌

《计算机应用》唯一官方网站 2024, 44 (11): 3587-3594. DOI: 10.11772/j.issn.1001-9081.2023111690

摘要（293）

HTML （6）

PDF （1125KB）（116）

基于特征嵌入的无监督异常检测方法通常使用patch级特征定位异常。patch级特征在图像级异常检测任务上具有竞争力，但在像素级定位方面存在精度不足的问题。为解决这一问题，提出一种由多尺度记忆库与分割网络组成的像素级异常检测方法MemAD。首先，通过预训练的特征提取网络对训练集中的正常样本进行特征提取，构建3个尺度下的正样本特征记忆库；其次，在训练分割网络时，计算模拟的伪异常样本特征与记忆库中距离最近的正样本特征的差特征，进一步引导分割网络学习如何定位异常像素。实验结果表明，MemAD在MVTec AD （MVTec Anomaly Detection）数据集上的图像级和像素级接受者操作特征曲线下面积（AUC）分别达到了98.0%和97.4%，优于大多数的现有方法，验证了它在像素级异常定位中的准确性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

38. 基于轨迹预测的安全强化学习自动变道决策方法

肖海林, 黄天义, 代秋香, 张跃军, 张中山

《计算机应用》唯一官方网站 2024, 44 (9): 2958-2963. DOI: 10.11772/j.issn.1001-9081.2023091266

摘要（288）

HTML （5）

PDF （1903KB）（617）

深度强化学习在自动变道决策问题中由于它的试错学习的特性，易在训练过程中导致不安全的行为。为此，提出一种基于轨迹预测的安全强化学习自动变道决策方法。首先，通过最大似然估计的概率建模并预测车辆的未来行驶轨迹；其次，利用得到的预测轨迹和安全距离指标进行驾驶风险评估，并且根据驾驶风险评估结果进行安全动作约束，将动作空间裁剪为安全动作空间，指导智能车辆避免危险动作。在仿真平台的高速公路场景中，将所提方法与深度Q网络（DQN）及其改进方法进行测试比较。实验结果表明，在智能车辆训练过程中，所提方法在保证快速收敛的同时，使碰撞发生的次数相较于对比方法降低了47%~57%，有效提高了训练过程中的安全性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

39. 基于知识图谱和时空扩散图卷积网络的港口交通流量预测

薛桂香, 王辉, 周卫峰, 刘瑜, 李岩

《计算机应用》唯一官方网站 2024, 44 (9): 2952-2957. DOI: 10.11772/j.issn.1001-9081.2023081100

摘要（286）

HTML （1）

PDF （1614KB）（789）

由于港口交通流量具有随机不确定性、时间不平稳特征，因此港口交通流量的精准预测是一项具有挑战性的任务。为了提高港口交通流量预测精度，考虑气象条件和港口相邻高速公路开闭状态等外部干扰因素，提出了一种基于知识图谱和时空扩散图卷积网络的港口交通流量预测算法KG-DGCN-GRU。知识图谱表示港口交通网络相关因素，知识表示方法从港口知识图谱中学习各外部因素的语义信息，扩散图卷积网络（DGCN）和门控循环单元（GRU）能有效挖掘港口交通流量的时空依赖特征。基于天津港交通数据集的实验结果表明，KG-DGCN-GRU能通过知识图谱和扩散图卷积有效提高预测精度，在单步预测（15 min）中与时间图卷积网络（T-GCN）和扩散卷积递归神经网络（DCRNN）相比，均方根误差（RMSE）分别降低了4.85%和7.04%，平均绝对误差（MAE）分别降低了5.80%和8.17%。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

40. 基于语义增强模式链接的Text-to-SQL模型

吴相岚, 肖洋, 刘梦莹, 刘明铭

《计算机应用》唯一官方网站 2024, 44 (9): 2689-2695. DOI: 10.11772/j.issn.1001-9081.2023091360

摘要（286）

HTML （25）

PDF （739KB）（1119）

为优化基于异构图编码器的Text-to-SQL生成效果，提出SELSQL模型。首先，模型采用端到端的学习框架，使用双曲空间下的庞加莱距离度量替代欧氏距离度量，以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图；其次，利用K头加权的余弦相似度以及图正则化方法学习相似度度量图使得初始模式链接图在训练中迭代优化；最后，使用改良的关系图注意力网络（RGAT）图编码器以及多头注意力机制对两个模块的联合语义模式链接图进行编码，并且使用基于语法的神经语义解码器和预定义的结构化语言进行结构化查询语言（SQL）语句解码。在Spider数据集上的实验结果表明，使用ELECTRA-large预训练模型时，SELSQL模型比最佳基线模型的准确率提升了2.5个百分点，对于复杂SQL语句生成的提升效果很大。

图表 | 参考文献 | 相关文章 | 多维度评价

摘要点击排行