《计算机应用》唯一官方网站

面向低能耗高性能的分类器两阶段数据选择方法

崔双双, 王宏志, 朱加昊, 吴昊

2025, 45(6): 1703-1711. DOI: 10.11772/j.issn.1001-9081.2024060883

摘要 ( )

HTML ( )

PDF (2107KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对利用海量数据构建分类模型时训练数据规模大、训练时间长且碳排放量大的问题，提出面向低能耗高性能的分类器两阶段数据选择方法TSDS （Two-Stage Data Selection）。首先，通过修正余弦相似度确定聚类中心，并将样本数据进行基于不相似点的分裂层次聚类；其次，对聚类结果按数据分布自适应抽样以组成高质量的子样本集；最后，利用子样本集在分类模型上训练，在加速训练过程的同时提升模型精度。在Spambase、Bupa和Phoneme等6个数据集上构建支持向量机（SVM）和多层感知机（MLP）分类模型，验证TSDS的性能。实验结果表明在样本数据压缩比达到85.00%的情况下，TSDS能将分类模型准确率提升3~10个百分点，同时加速模型训练，使训练SVM分类器的能耗平均降低93.76%，训练MLP分类器的能耗平均降低75.41%。可见，TSDS在大数据场景的分类任务上既能缩短训练时间和减少能耗，又能提升分类器性能，从而助力实现“双碳”目标。

基于最大均值差异的子空间高斯混合模型聚类集成算法

何玉林, 李旭, 贺颖婷, 崔来中, 黄哲学

2025, 45(6): 1712-1723. DOI: 10.11772/j.issn.1001-9081.2024070943

摘要 ( )

HTML ( )

PDF (2129KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对高斯混合模型（GMM）聚类算法在处理大规模高维数据聚类时出现的性能受限和参数敏感的问题，提出一种基于最大均值差异（MMD）的子空间GMM聚类集成（SGMM-CE）算法。首先，对原始大规模高维数据集进行随机样本划分（RSP）以得到多个数据子集，从样本量的角度缩小聚类问题的规模；其次，根据特征对最优GMM构件数的影响，在每一个数据子集对应的高维特征空间中进行子空间学习，得到每个高维特征空间对应的多个低维特征子空间，并在各个子空间上进行GMM聚类，从而得到一系列异构的GMM；再次，利用所提出的平均共享隶属概率（ASAP），重标记与融合来自同一个数据子集的不同特征子空间上的聚类结果；最后，利用扩展的子空间MMD（SubMMD）作为不同数据子集的聚类结果中2个簇之间的分布一致性的度量准则，据此重标记并融合这些数据子集的聚类结果，进而得到原始数据集的最终聚类集成结果。通过详尽的实验验证SGMM-CE算法的有效性，实验结果显示，相较于对比算法中最好的元簇聚类算法（MCLA），SGMM-CE算法在选用的数据集上的平均标准化互信息（NMI）、聚类精度（CA）和调整兰德系数（ARI）值分别提升了19%，20%和52%。此外，可行性和合理性的实验结果证实了SGMM-CE算法的参数收敛性与时间高效性，表明该算法具备高效处理大规模高维数据聚类问题的能力。

集成句法与情感知识的方面级情感分析模型

李自亮, 朱广丽, 张玉雷, 刘佳佳, 焦熠璇, 张顺香

2025, 45(6): 1724-1731. DOI: 10.11772/j.issn.1001-9081.2024060903

摘要 ( )

HTML ( )

PDF (1499KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

方面级情感分析（ABSA）是一项细粒度的情感分析任务，旨在分析给定文本中特定方面词的情感极性。现有的ABSA方法采用图卷积网络（GCN）处理句法和语义信息，然而这些方法将方面词的所有句法依赖等同看待，忽略了远距离不相关词对目标方面词的影响，造成目标方面词和观点词权重分配的不适宜，且对语义信息提取不充分。针对这些问题，提出一种集成句法与情感知识的ABSA模型。首先，根据句法信息构建可达矩阵，以此为基础，利用方面词进行中心位置赋权构建句法增强图；其次，通过外部情感知识和方面增强构建语义增强图，利用图卷积分别对句法增强图和语义增强图进行充分建模形成不同的特征通道；再次，通过双仿射注意力更有效地交互融合句法信息和语义信息；最后，运用平均池化和拼接操作获取方面词对应的最终特征向量。实验结果表明，相较于深度依赖感知图卷积网络模型DA-GCN-BERT （deep Dependency Aware GCN+BERT（Bidirectional Encoder Representations from Transformers）），所提模型在5个公开数据集上的准确率分别提高了1.71、1.41、1.27、0.17和0.43个百分点。可见，所提模型在ABSA领域具有很强的适用性。

基于对比学习增强双注意力机制的多标签文本分类方法

余明峰, 秦永彬, 黄瑞章, 陈艳平, 林川

2025, 45(6): 1732-1740. DOI: 10.11772/j.issn.1001-9081.2024070909

摘要 ( )

HTML ( )

PDF (1801KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对现有的基于注意力机制的方法难以捕捉文本之间复杂的依赖关系的问题，提出一种基于对比学习增强双注意力机制的多标签文本分类方法。首先，分别学习基于自注意力和基于标签注意力的文本表示，并融合二者以获得更全面的文本表示捕捉文本的结构特征以及文本与标签之间的语义关联；其次，给定一个多标签对比学习目标，利用标签引导的文本相似度监督文本表示的学习，以捕捉文本之间在主题、内容和结构层面上复杂的依赖关系；最后，使用前馈神经网络作为分类器进行文本分类。实验结果表明，相较于LDGN（Label-specific Dual Graph neural Network），所提方法在EUR-Lex（European Union Law Document）数据集与Reuters-21578数据集上的排名第5处的归一化折现累积收益（nDCG@5）值分别提升了1.81和0.86个百分点，在AAPD（Arxiv Academic Paper Dataset）数据集与RCV1（Reuters Corpus Volume Ⅰ）数据集上也都取得了有竞争力的结果。可见，所提方法能有效捕捉文本之间在主题、内容和结构层面上复杂的依赖关系，从而在多标签文本分类任务上取得较优结果。

融合时序行为链与事件类型的类案检索方法

詹力林, 秦永彬, 黄瑞章, 王华, 陈艳平

2025, 45(6): 1741-1747. DOI: 10.11772/j.issn.1001-9081.2024070917

摘要 ( )

HTML ( )

PDF (1642KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对现有的类案检索（LCR）方法缺乏对案情要素的有效利用而容易被案例内容的语义结构相似性误导的问题，提出一种融合时序行为链与事件类型的类案检索方法。首先，采取序列标注的方法识别案情描述中的法律事件类型，并利用案例文本中的行为要素构建时序行为链，以突出案情的关键要素，从而使模型聚焦于案例的核心内容，进而解决现有方法易被案例内容的语义结构相似性误导的问题；其次，利用分段编码构造时序行为链的相似性向量表征矩阵，从而增强案例间行为要素的语义交互；最后，通过聚合评分器，从时序行为链、法律事件类型、犯罪类型这3个角度衡量案例的相关性，从而增加案例匹配得分的合理性。实验结果表明，相较于SAILER（Structure-Aware pre-traIned language model for LEgal case Retrieval）方法，所提方法在LeCaRD（Legal Case Retrieval Dataset）上的P@5值提升了4个百分点、P@10值提升了3个百分点、MAP值提升了4个百分点，而NDCG@30值提升了0.8个百分点。可见，该方法能有效利用案情要素来避免案例内容的语义结构相似性的干扰，并能为类案检索提供可靠的依据。

面向机器理解的可视化交互信息重构方法

李昕, 刘雯, 廖集秀, 杨宗驰

2025, 45(6): 1748-1755. DOI: 10.11772/j.issn.1001-9081.2024060904

摘要 ( )

HTML ( )

PDF (3602KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

可视化重构技术旨在将图形转换为机器能够解析和操作的数据形式，为可视化的大规模分析、重用及检索等提供必备的基础信息；然而，现有的重构方法明显侧重于视觉信息的恢复，忽视了交互信息在数据分析和理解中发挥的关键作用。针对上述问题，提出一种面向机器理解的可视化交互信息重构方法。首先，形式化定义交互，将可视元素划分为不同的视觉组，采用自动化工具提取可视化图形的交互信息；其次，解耦交互与可视元素的关联，将交互分离为独立的实验变量，构建交互实体库；再次，制定规范的声明式语言，实现交互信息的查询；最后，设计迁移规则，基于可视元素匹配与自适应调整机制实现交互在不同可视化间的迁移适配。实验案例针对可视化问答、查询和迁移等面向机器理解的下游任务，结果显示增加交互信息能够使机器理解可视化交互的语义，从而拓展上述任务的应用范围。以上实验结果验证了所提方法能够使重构后的可视化图形通过融合动态交互信息而达成结构完整性。

基于区块链的数字内容版权保护和公平追踪方案

王利娥, 林彩怡, 李永东, 傅星珵, 李先贤

2025, 45(6): 1756-1765. DOI: 10.11772/j.issn.1001-9081.2024060901

摘要 ( )

HTML ( )

PDF (3016KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对数字内容版权保护和追踪过程中的版权所有者恶意诬陷购买者，以及购买者知道自己的水印而进行去水印操作的问题，提出一种基于区块链的数字内容版权保护和公平追踪方案。首先，使用Paillier同态加密算法和密钥分发智能合约更改密文状态下购买者水印，并将水印嵌入加密的数字内容；其次，通过区块链中的验证节点调用密钥分发智能合约和仲裁智能合约，解决传统版权保护方案存在的单点故障问题；最后，通过实验验证所提方案的性能。结果表明，所提方案在数字内容尺寸（像素×像素）为1 024×1 024时，相较于针对垂直行业服务信息泄露的区块链问责机制，所提方案加密和嵌入水印的总时间减少了94.92%，总解密时间减少了79.72%。可见，所提方案的总时间和运行成本低，具有良好的运行效率，能够广泛用于数字内容版权保护领域。

联合任务卸载和资源优化的车辆边缘计算方案

薛天宇, 李爱萍, 段利国

2025, 45(6): 1766-1775. DOI: 10.11772/j.issn.1001-9081.2024060905

摘要 ( )

HTML ( )

PDF (3414KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对车辆边缘计算（VEC）中存在的用户体验质量需求不断增加、高度移动车辆引起的链路状态获取困难和异构边缘节点为车辆提供资源的时变性等问题，制定一种联合任务卸载和资源优化（JTO-RO）的VEC方案。首先，在不失一般性的前提下，综合考虑边缘内和边缘间干扰，提出一种车辆到基础设施（V2I）的传输模型，该模型通过引入非正交多址接入（NOMA）技术使边缘节点不仅无需依赖链路状态信息，还可以提升信道容量；其次，为了提高系统的性能和效率，设计一种多智能体双延迟深度确定性（MATD3）算法用于制定任务卸载策略，这些策略可通过与环境的交互学习进行动态调整；再次，联合考虑2种策略的协同作用，并制定将最大化任务服务比率作为目标的优化方案，从而满足不断提升的用户体验质量需求；最后，对真实车辆轨迹数据集进行仿真实验。结果表明，相较于当前具有代表性的3种方案（分别以随机卸载（RO）算法、D4PG （Distributed Distributional Deep Deterministic Policy Gradient）算法和MADDPG （Multi-Agent Deep Deterministic Policy Gradient）算法为任务卸载算法的方案）在3类场景下（普通场景、任务密集型场景和时延敏感型场景），所提方案的平均服务比率分别提高了20%、10%和29%以上，验证了该方案的优势和有效性。

基于神经网络的多尺度信息融合时间序列长期预测模型

李岚皓, 严皓钧, 周号益, 孙庆赟, 李建欣

2025, 45(6): 1776-1783. DOI: 10.11772/j.issn.1001-9081.2024070930

摘要 ( )

HTML ( )

PDF (1260KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

时间序列数据广泛来源于社会各个领域，从气象学到金融学再到医学，准确的长期预测是时间序列数据分析、处理与研究中的一个关键问题。针对时间序列数据中存在的不同尺度相关性的挖掘与利用，提出一种基于神经网络的多尺度信息融合时间序列长期预测模型ScaleNN，旨在更好地处理时间序列数据中的多尺度问题，从而实现更准确的长期预测。首先，结合全连接神经网络和卷积神经网络，有效提取全局信息与局部信息，并将2种信息聚合后进行预测；其次，通过在全局信息表征模块中引入压缩机制，以更轻量化的结构接受更长的序列输入，增大模型的感知范围并提高模型效能。大量实验结果表明，ScaleNN在多个真实世界数据集上的性能优于当前该领域的优秀模型PatchTST （Patch Time Series Transformer），在运行时间降低35%的同时仅需19%的参数量。可见，ScaleNN可广泛应用于不同领域的时间序列预测问题，为交通流量预测、天气预报等领域提供预测的基础。

基于图对比学习的再入院预测模型

姜超英, 李倩, 刘宁, 刘磊, 崔立真

2025, 45(6): 1784-1792. DOI: 10.11772/j.issn.1001-9081.2024060902

摘要 ( )

HTML ( )

PDF (1708KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对疾病间的共同作用与再入院情况的关系的挖掘不足以及相关模型泛化能力较弱的问题，提出一种基于图对比学习的再入院预测模型HealthGraph。首先，利用数据集中的疾病共现信息构建疾病编码图，以充分挖掘疾病之间的关联信息；其次，提出一种以图对比学习的思想为指导的患者数据增强方法，通过图采样器自适应地捕捉与任务相关的拓扑结构，构造新视图，提升数据丰富度，从而提高模型的泛化性能；最后，结合初始疾病编码图嵌入和新视图嵌入进行再入院预测。在真实数据集MIMIC-Ⅲ上构建呼吸系统疾病和循环系统疾病这2个数据集并进行大量实验。结果表明，相较于反转时间注意力模型（RETAIN）和阶段感知神经网络模型（StageNet），所提模型在准确率和F1指标上提升了1个百分点左右。此外，2组消融实验结果验证了所提模型在提高再入院预测的准确性和泛化性中的有效性。

融合三元组和文本属性的多视图实体对齐

翟社平, 黄妍, 杨晴, 杨锐

2025, 45(6): 1793-1800. DOI: 10.11772/j.issn.1001-9081.2024050703

摘要 ( )

HTML ( )

PDF (1754KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

实体对齐（EA）旨在识别不同来源的知识图谱（KG）中指代相同的实体。现有的EA模型大多关注实体自身的特征，部分模型引入了实体的关系和属性信息辅助实现对齐，然而这些模型忽视了实体中潜在的邻域信息和语义信息。为了解决上述问题，提出一种融合三元组和文本属性的多视图EA模型（MultiEA）。所提模型将实体信息分为多个视图以实现对齐。针对缺少邻域信息的问题，采用图卷积网络（GCN）与翻译模型来并行学习嵌入实体的关系信息；针对缺少语义信息的问题，采用词嵌入与预训练语言模型学习属性文本的语义信息。实验结果表明，在DBP15K的3个子数据集上，相较于得到最优结果的基线模型EPEA（Entity-Pair Embedding Approach for KG alignment），所提模型的Hits@1值分别提升了2.18、1.36和0.96个百分点，平均倒数排名（MRR）分别提升了2.4、0.9和0.5个百分点，验证了所提模型的有效性。

结合语义增强和感知注意力的关系抽取方法

杨大伟, 徐西海, 宋威

2025, 45(6): 1801-1808. DOI: 10.11772/j.issn.1001-9081.2024060776

摘要 ( )

HTML ( )

PDF (1839KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对文本特征提取时缺乏考虑句子的上下文判别性特征以及未能充分利用实例和关系标签之间的关联信息的问题，提出一种结合语义增强和感知注意力的关系抽取方法（SPRE）。首先，在句子特征编码阶段，构建语义增强机制（SEM）提取句子的显著性语义特征，通过实体感知词嵌入和显著特征感知（SFP）得到显著信息增强的句子表示；其次，设计感知注意力机制（PAM）整合句子特征，通过感知句子与关系标签之间的语义信息、句子的实体类型与对应关系的实体类型之间的一致性信息，以及句子之间的相似性信息评估句子与关系标签的匹配程度，充分利用包中实例与关系标签的依赖关系，进一步提高方法的降噪能力；最后，利用分类器进行关系预测并根据预测结果与实际结果的交叉熵调整网络参数。在NYT-10（New York Times 10）和GDS（Google Distant Supervision）数据集上的实验结果表明，在NYT-10数据集上，与基于BERT（Bidirectional Encoder Representations from Transformers）的关系抽取方法PARE（Passage-Attended Relation Extraction）相比，所提方法在曲线下面积（AUC）上提升了2.1个百分点，在按置信度降序排列后前100、200 和300条数据精确率Precision@N（P@N）的平均值P@M上提升了2.4个百分点；在GDS数据集上，所提方法的AUC和P@M分别达到了90.5%和97.8%。所提方法在上述2个数据集上均明显优于主流的远程监督关系抽取方法，验证了该方法的有效性。可见，在主流的远程监督关系抽取任务中，所提方法能有效地提升模型对数据特征的学习能力。

基于实体表示增强的文档级关系抽取

王海杰, 张广鑫, 史海, 陈树

2025, 45(6): 1809-1816. DOI: 10.11772/j.issn.1001-9081.2024050682

摘要 ( )

HTML ( )

PDF (1555KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对现有的文档级关系抽取（DocRE）任务的实体表示学习存在的忽视实体提及差异性和缺少实体对关系抽取复杂度的计算范式的问题，提出一种基于实体表示增强的DocRE模型（DREERE）。首先，利用注意力机制评估实体提及在判定不同实体对关系时的差异性，得到更灵活的实体表示；其次，利用编码器计算得到的实体对句子重要性分布评估实体对关系抽取的复杂度，再选择性地利用实体对之间的两跳信息增强实体对的表示；最后，在3个流行的数据集DocRED、Re-DocRED和DWIE上进行实验。结果显示，与最优基线模型（如ATLOP（Adaptive Thresholding and Localized cOntext Pooling）、E2GRE（Entity and Evidence Guided Relation Extraction））相比，DREERE的F1值分别提高了0.06、0.14和0.23个百分点，忽略训练集出现的三元组而计算得到的F1分数（ign-F1）值分别提高了0.07、0.09和0.12个百分点，可见该模型能够有效获取文档里的实体语义信息。

融合噪声过滤的超关系知识图谱补全方法

刘爽, 刘大庆, 孟佳娜, 赵迪

2025, 45(6): 1817-1826. DOI: 10.11772/j.issn.1001-9081.2024060792

摘要 ( )

HTML ( )

PDF (3183KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对超关系知识图谱中限定符会为主三元组引入无关噪声的问题，提出一种融合噪声过滤的超关系知识图谱补全方法（HRNF）。首先，为了有效增强超关系事实，构建特征增强模块；同时，利用卷积神经网络（CNN）提取普通三元组特征，并通过异构图神经网络（HGNN）捕获超关系事实中的复杂关系特征；其次，融合这2种特征，利用普通三元组的稳定性与可靠性增强超关系事实中主三元组的信息，减少限定符引入噪声的影响；再次，为了更准确地融合特征表示，构建相关性感知模块；同时，利用图注意力网络（GATv2），通过动态学习不同节点间的权重更新增强后的特征表示；继次，为了捕获复杂的语义信息，构建语义增强模块；最后利用Transformer模型，通过自注意力机制捕获序列中任意2个元素之间的依赖关系，从而生成最终的预测序列。为了验证HRNF的有效性，在2个常用的数据集Wikipeople和JF17K上进行广泛的实验。结果表明，相较于基线方法中较优的GRAN（GRAph-based N-ary relational learning），在预测主三元组实体时，HRNF在Wikipeople数据集上的平均倒数排名（MRR）、Hits@1和Hits@10分别提升了0.6、1.1和1.8个百分点，在JF17K数据集上的MRR、Hits@1和Hits@10分别提升了0.5、0.7和2.9个百分点。以上这些显著提升证明了HRNF在处理超关系知识图谱补全任务中可以有效地缓解限定符带来的噪声问题。

基于代码生成的细粒度情感分析方法

帅健, 王中卿, 陈嘉沥

2025, 45(6): 1827-1832. DOI: 10.11772/j.issn.1001-9081.2024060885

摘要 ( )

HTML ( )

PDF (1029KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

细粒度情感分析（ABSA）任务越来越受到人们的关注。针对目前主流的ABSA方法无法充分利用语义关系且无法充分学习各情感元素之间联系的局限，提出一种基于代码生成的ABSA方法。首先，对应各情感元素与编程语言（PL）；其次，按照对应原则将实验数据集构造成代码生成任务的数据样式，代码样式可以更好地表达各情感元素之间的联系；最后，利用当前大语言模型（LLM）的强大性能及代码生成方法在事件抽取任务上的良好表现得到更准确的结果。为了验证所提方法的有效性，使用Paraphrase、Seq2Path和意见树生成（OTG）方法进行对比实验。实验结果表明，所提方法在ABSA任务中的餐厅数据集上F1分数比OTG方法高2.82个百分点，具有更好的效果。

面向城市排水管网缺陷诊断的鲁棒无监督多任务异常检测方法

闫龙博, 毛文涛, 仲志鸿, 范黎林

2025, 45(6): 1833-1840. DOI: 10.11772/j.issn.1001-9081.2024050739

摘要 ( )

HTML ( )

PDF (5059KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

目前利用机器学习技术对城市排水管网渗漏等典型缺陷状态检测异常已成为城市智能管理的焦点；但实际场景下采集的管网监测数据包含了大量噪声，尤其是降雨造成的液位数据突变，会严重影响管网渗漏检测结果的准确性和可靠性。为解决上述问题，提出一种面向排水管网缺陷诊断的鲁棒无监督多任务异常检测方法。首先，构建融合多个物理监测站点时空信息的深度多任务支持向量数据描述（SVDD）模型，针对各站点分别建立基于超球的单分类判别器，以提取各站点异常检测规则，并建立规则适配机制，获得多个站点的公共特征表示；其次，基于所获得的特征表示，对各站点的SVDD模型进一步引入滑动窗口，连续识别管网监测数据中的异常波动，进而确定管网监测数据序列中公共干扰因素造成的噪声点，并对噪声点进行多项式插值修正，由此排除降雨等产生的不规则噪声干扰；最后，使用修正后的监测序列进行基于自编码器（AE）重构误差的管网渗漏检测。利用常州市清潭水务管理系统采集的2017—2018年城区排水管网监测数据进行验证，结果显示，所提方法和人工检修结果相符合，同时相较于基于统计方法和传统机器学习方法，检测结果更准确，误检率更低。以清潭东区域为例，该方法在应对降雨干扰时的误检率较次优方法USAD（Unsupervised Anomaly Detection）降低了5.47个百分点，显著提升了模型在强噪声场景下的鲁棒性，进一步验证了所提方法的准确性与实用性。

融合变分自编码器与自适应增强卷积神经网络的网络流量分类模型

李道全, 徐正, 陈思慧, 刘嘉宇

2025, 45(6): 1841-1848. DOI: 10.11772/j.issn.1001-9081.2024060840

摘要 ( )

HTML ( )

PDF (2173KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

网络流量分类问题一直是一种随着网络通信发展而不断迭代方法的难题，发展至今已有多种解决方法。目前对网络数据进行分类时大多数方法会将目光聚集在种类均衡的数据集上以便于实验和计算。针对大部分现实网络数据集仍不平衡的问题，提出一种融合变分自编码器（VAE）与自适应增强卷积神经网络（AdaBoost-CNN）的网络流量分类模型VAE-ABC （Variational AutoEncoder-Adaptive Boosting-Convolutional neural network）。首先，在数据层面使用VAE对不平衡数据集进行部分增强，并利用VAE学习数据潜在分布的特性缩短学习时间；其次，为了在算法层面提高分类效果，结合集成学习的思想，以自适应增强（AdaBoost）算法为基础设计一种使用改进的卷积神经网络（CNN）作为弱分类器的AdaBoost-CNN算法，从而提高学习和训练的准确率；最后，使用全连接层完成特征映射，并通过激活函数Sigmoid获得最终的分类结果。多重对比实验的结果表明，所提模型在分类数据集ISCX VPN-nonVPN划分后的不平衡子数据集上的准确率达到了94.31%，对比使用支持向量机（SVM）作为弱分类器的AdaBoost-SVM、使用SMOTE （Synthetic Minority Oversampling TEchnique）算法与SVM结合的SMOTE-SVM、使用决策树（D-T）作为弱分类器并与SMOTE算法结合的SMOTE-AB-D-T，所提模型的准确率分别提高了1.34、0.63和0.24个百分点。可见，所提模型在该数据集上的分类效果优于其他模型。

融合变分图自编码器与局部-全局图网络的认知负荷脑电识别模型

周天彤, 郑妍琪, 魏韬, 戴亚康, 邹凌

2025, 45(6): 1849-1857. DOI: 10.11772/j.issn.1001-9081.2024060794

摘要 ( )

HTML ( )

PDF (2006KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对认知负荷识别模型存在过于依赖手动特征提取、忽视脑电图（EEG）信号的空间信息和无法有效学习图结构数据的问题，提出一种融合变分图自编码器（VGAE）与局部-全局图网络（VLGGNet）的认知负荷EEG识别模型。该模型由时间学习模块和图形学习模块这2个部分组成。首先，使用时间学习模块通过多尺度时间卷积捕捉EEG信号的动态频率表示，并通过空间与通道重建卷积（SCConv）和1 $×$ 1卷积核级联模块融合多尺度卷积提取的特征；其次，使用图形学习模块将EEG数据定义为局部-全局图，其中，局部图特征提取层将节点属性聚合到一个低维向量，全局图特征提取层通过VGAE重构图结构；最后，对全局图和节点特征向量执行轻量化图卷积操作，由全连接层输出预测结果。通过嵌套交叉验证，实验结果表明，在心算任务（MAT）数据集上，相较于次优的局部-全局图网络（LGGNet），VLGGNet的平均准确率（mAcc）和平均F1分数（mF1）分别提升了4.07和3.86个百分点；在同时任务EEG工作量（STEW）数据集上，相较于表现最好的多尺度时空卷积神经网络（TSception），VLGGNet的mAcc与TSception相同，mF1仅降低了0.01个百分点。可见VLGGNet提高了认知负荷分类的性能，也验证了前额叶和额叶区域与认知负荷状态密切相关。

基于联合自监督学习的多模态融合推荐算法

吴宗航, 张东, 李冠宇

2025, 45(6): 1858-1868. DOI: 10.11772/j.issn.1001-9081.2024060824

摘要 ( )

HTML ( )

PDF (1860KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对多模态推荐算法的数据稀疏性问题，以及现有的自监督学习（SSL）算法往往集中在对数据集中单一特征的SSL上，而忽视了多特征联合学习的可能性的问题，提出一种基于联合SSL的多模态融合推荐算法SFELMMR （SelF supErvised Learning for MultiModal Recommendation）。首先，整合并优化现有的SSL策略，以通过联合学习不同模态的数据特征，显著增强数据的表示能力，从而缓解数据稀疏性的问题；其次，通过融合全局视角下的深层次项目关系和局部视角下的直接相互作用，设计一种构造多模态潜在语义图的方法，使算法能更精准地捕捉项目间的复杂联系；最后，在3个数据集上进行实验。结果表明，与现有算法中表现最佳的多模态推荐算法相比，所提算法在多个推荐性能指标上取得了显著提升。具体地，所提算法的Recall@10分别提升了5.49%、2.56%、2.99%，NDCG@10分别提升了1.17%、1.98%、3.52%，Precision@10分别提升了4.69%、2.74%、1.22%，Map@10分别提升了0.81%、1.59%、3.11%。此外，通过对所提算法进行消融实验，验证了该算法的有效性。

基于风味嵌入异构图层次学习的食谱推荐模型

颜文婧, 王瑞东, 左敏, 张青川

2025, 45(6): 1869-1878. DOI: 10.11772/j.issn.1001-9081.2024060859

摘要 ( )

HTML ( )

PDF (2465KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对食谱推荐任务中信息维度不全面、交互数据稀疏和交互信息冗余的问题，提出一种基于风味嵌入异构图层次学习的食谱推荐模型（RecipeFlavor）。首先，引入风味分子维度，并基于用户、食物、食材和食材的风味物质构建异构图，有效表示4种节点之间的联系；其次，基于信息传递机制构建基于异构图的层级学习模块，并结合压缩注意力（SA）机制，将节点的不同关系视为不同的信息通道，提取节点之间的关键交互信息并抑制噪声；最后，基于特征感知噪声构建对比学习（CL）模块，在模型学习中引入正负样本区分任务，增强用户和食谱节点之间的信息关联，提升模型对特征的学习能力。实验结果表明，RecipeFlavor在Recipe 1M+大型数据集上，与HGAT（Hierarchical Graph ATtention network for recipe recommendation）模型相比，曲线下面积（AUC）提升了1.44个百分点，Top-10的模型精确度（Pre）、命中率（HR）、平均精度（MAP）和归一化折损累计增益（NDCG）分别提升了0.76、6.11、2.68和3.05个百分点。可见，风味分子信息的引入拓展了食谱推荐的学习维度，而RecipeFlavor能有效提取异构图中的关键信息，增强用户和食谱之间的关联性，从而提升食谱推荐的精度。

混合信息增强的论文推荐方法

郭盼盼, 周刚, 卢记仓, 李珠峰, 祝涛杰

2025, 45(6): 1879-1887. DOI: 10.11772/j.issn.1001-9081.2024050708

摘要 ( )

HTML ( )

PDF (2014KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对传统协同过滤（CF）存在的数据稀疏和冷启动的问题以及在矩阵分解方法生成结果矩阵的过程中由于各种变换产生误差的问题，提出一种混合信息增强的低秩稀疏矩阵分解（LSMF）论文推荐方法。首先，利用预训练的文档级表示学习和引文感知转换器SPECTER（Scientific Paper Embeddings using Citation-informed TransformERs）学习论文的表示，计算并构造文章之间的相似度矩阵，将相似度矩阵与引文矩阵相加得到一个混合信息矩阵；其次，通过矩阵乘法将内容相似信息与引用信息融入到论文-作者矩阵中；最后，利用LSMF模型分解论文-作者矩阵以得到推荐列表。在ACL文集网络（AAN）和DBLP数据集上的实验结果表明，所提方法取得了较好的推荐性能，且所提方法引入内容信息与引用信息的方式同样适用于其他矩阵分解模型。对于非负矩阵分解（NMF）、奇异值分解（SVD）、低秩稀疏矩阵补全（LSMC）和去分解（GoDec），利用混合信息后的模型比未利用混合信息的原模型在2个数据集上的前30个推荐结果的召回率（R@30）分别提升了18.72、7.43、11.53、14.62和20.58、2.11、7.91、5.01个百分点。

科研论文的可比性评估与比较性引文生成方法

李翔宇, 陈景强

2025, 45(6): 1888-1894. DOI: 10.11772/j.issn.1001-9081.2024060898

摘要 ( )

HTML ( )

PDF (1508KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对比较性引文生成中面临的两大挑战——准确判定论文间的可比性及生成具有比较性的句子，提出科研论文的可比性评估（CA）与比较性引文生成方法SciCACG（Scientific Comparability Assessment and Citation Generation）。该方法构建了3个核心模块：用于判断2篇论文是否具备可比性的CA模块、负责从论文与参考文献中抽取出具体的比较对象的比较对象抽取（CE）模块和用于生成相应的比较性引用句子的比较引文生成模块。首先，利用SciBERT （Scientific BERT）模型处理输入的2篇文章，并通过CA模块进行可比性的评估；其次，对于被判定为可比的文章，采用CE模块识别并抽取出关键的比较对象；最后，使用比较引文生成模块生成包含这些比较对象的比较性引文。实验结果显示，在CA阶段，所提方法在平均倒数排名（MRR）上达到了0.532，在召回率@10（R@10）上达到了0.731，较之前的SciBERT-FNN（Scientific Bidirectional Encoder Representations from Transformers-Feedforward Neural Network）方法在各个数据集上均有提升；在比较性引文生成中，相较于次优的BART-Large（Bidirectional and Auto-Regressive Transformers-Large）方法，所提方法的ROUGE（Recall-Oriented Understudy for Gisting Evaluation）-1、ROUGE-2和ROUGE-L的F1分数分别提高了1.90、1.29和2.55个百分点。此外，实验结果验证了科学文献自动化比较与分析技术对引文句子生成任务具有重要意义，特别是在提高比较信息的可追溯性和确保引用句子信息的全面性方面，展现出极大的实用价值。

基于均匀流型逼近与投影的高级加密标准算法相关功耗分析方法

张润莲, 唐瑞锋, 王蒿, 武小年

2025, 45(6): 1895-1901. DOI: 10.11772/j.issn.1001-9081.2024060867

摘要 ( )

HTML ( )

PDF (4616KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

侧信道攻击（SCA）中所采集的能量迹数据的高噪声和高维度大幅降低了SCA的效率和密钥恢复的准确率。针对上述问题，提出一种基于均匀流型逼近与投影（UMAP）的高级加密标准（AES）算法相关功耗分析（CPA）方法。所提方法基于欧氏距离计算能量迹数据的邻近点集合。首先，通过构建邻接图并计算邻近点之间的相似度得到加权邻接图，从而捕获能量迹数据之间的位置关系以保留数据的局部结构特征；其次，利用拉普拉斯矩阵描述邻接图的结构关系，并通过特征分解取特征值较小的特征向量作为初始化的低维数据；同时，为了保留数据的全局结构特征，使用二进制交叉熵作为优化函数调整数据在低维空间中的位置；此外，为了提升计算效率，在梯度下降过程中使用力导向图布局算法；最后，对降维后的数据进行相关功耗攻击以恢复密钥。实验结果表明，UMAP方法能够有效保留原始能量迹数据的局部和全局结构特征；所提方法能够提高能量迹数据和假设功耗泄露模型之间的相关性，减少恢复密钥所需的能量迹条数，具体地，所提方法恢复单个密钥字节需要的能量迹条数为180，恢复全部16个密钥字节需要的能量迹条数为700；相较于等距特征映射（ISOMAP）降维方法，所提方法恢复所有密钥字节所需的能量迹条数减少了36.4%。

基于联盟链的车载电子证据保全及其访问控制

邵鑫, 陈自刚, 杨兴春, 朱海华, 罗文俊, 陈龙, 周由胜

2025, 45(6): 1902-1910. DOI: 10.11772/j.issn.1001-9081.2024030263

摘要 ( )

HTML ( )

PDF (2356KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在当今社会中，频发的汽车交通事故依然是一个严峻的现实问题。为了确保车载电子证据的可信保全和合法使用，必须采取先进的安全技术手段和严格的访问控制机制。针对车载设备电子证据的保全与共享需求，提出一种基于联盟链的证据保全及访问控制方案。首先，基于联盟链技术和星际文件系统（IPFS）实现电子证据的链上链下存储，并通过对称密钥保证证据的机密性和哈希值验证证据的完整性；其次，在电子证据的上传、管理和下载过程中，引入融合属性和角色的访问控制机制，实现细粒度和动态的访问控制管理，从而确保证据的合法访问与共享；最后，对比方案与分析性能。实验结果表明，所提方案具备机密性、完整性和不可否认性，并且在高并发请求数的情况下具有稳定性。

基于浅层人工神经网络的可移植执行恶意软件静态检测模型

花天辰, 马晓宁, 智慧

2025, 45(6): 1911-1921. DOI: 10.11772/j.issn.1001-9081.2024060857

摘要 ( )

HTML ( )

PDF (3218KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对基于深度学习的可移植执行（PE）恶意软件检测方法中，数据集存在的不平衡或不完整问题，以及神经网络结构过深或特征集庞大而导致的模型计算资源开销和耗时增加问题，提出一种基于浅层人工神经网络（SANN）的PE恶意软件静态检测模型。首先，利用LIEF（Library to Instrument Executable Formats）库创建PE特征提取器从EMBER数据集中提取PE文件样本，并提出一种特征组合，该特征集具备更少的PE文件特征，从而在减小特征空间和模型参数量的同时能够提高深度学习模型的性能；其次，生成特征向量，通过数据清洗去除未标记的样本；再次，对特征集内的不同特征值进行归一化处理；最后，将特征向量输入SANN中进行训练和测试。实验结果表明，SANN可达到95.64%的召回率和95.24%的准确率，相较于MalConv模型和LightGBM模型，SANN的准确率分别提高了1.19和1.57个百分点。SANN的总工作耗时约为用时最少的对比模型LightGBM的1/2。此外，SANN在面对未知攻击时具备较好的弹性，且仍能够保持较高的检测水平。

面向多样计算场景的检查点技术综述

陈筱琳, 张亚强, 史宏志

2025, 45(6): 1922-1933. DOI: 10.11772/j.issn.1001-9081.2024050697

摘要 ( )

HTML ( )

PDF (2781KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

检查点技术是一种在计算系统中保存当前计算任务和系统状态的方法，可应用于系统故障恢复、作业迁移和作业抢占等诸多场景。随着技术的发展，计算场景更多元，计算规模更大，计算系统的结构层次更复杂，且计算环境更多变，这些会导致故障发生的概率增加。同时，平均故障间隔时间（MTBT）从［6.50 h， 40.00 h］缩短至1.25 h。因此，作为典型容错手段的检查点技术显得越来越重要。首先，介绍多样计算场景的检查点技术近年来的发展概况，并基于现有技术的特点对它们进行分类；其次，回顾包括增量检查点、多级异步检查点、最优检查点间隔和基于故障感知的检查点这4个方向在内的最新研究进展，并总结检查点技术在面向多样计算场景时的发展趋势——动态化、智能化和主动化，以及该技术面临的挑战；最后，通过梳理优化检查点策略的主要思路和最新方法，帮助研究人员快速掌握检查点技术的现状和未来发展趋势。

空间众包中支持周期性任务的在线匹配算法

刘俊岭, 孙萌, 孙焕良, 许景科

2025, 45(6): 1934-1944. DOI: 10.11772/j.issn.1001-9081.2024060747

摘要 ( )

HTML ( )

PDF (2341KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对空间众包中的一类重复多次且有固定需求的周期性任务，现有的匹配算法忽略了周期性任务对熟悉度的需求，提出一种空间众包中支持周期性任务的在线匹配算法。首先，将在线匹配问题视为多人游戏，将任务视为游戏的独立参与者，根据任务倾向于匹配熟悉度高的工人，工人倾向于匹配报酬高、距离近的任务的需求，确定玩家的效用函数，并进行博弈论（GT）分析；其次，将模拟退火（SA）策略引入GT的更新策略中，设计基于SA策略的GT算法；最后，在达到纳什均衡时实现总效用更大的匹配。在真实数据集上的实验结果表明，相较于现有相关算法，所提GT算法的匹配具有最高的总效用。可见，所提GT算法实现了更符合周期性任务和工人各自需求的匹配结果，可以提升在线空间众包平台的用户满意度。

“双碳”目标下基于改进型NSGA-Ⅱ的港口作业调度优化算法

刘树东, 吴昊, 丛佳, 顾播宇

2025, 45(6): 1945-1953. DOI: 10.11772/j.issn.1001-9081.2024060757

摘要 ( )

HTML ( )

PDF (2637KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着全球气候变化问题的日益严峻，我国提出了“双碳”目标（碳达峰和碳中和）。而港口作为物流枢纽和货物集散地，它的碳排放问题尤为突出。针对港口作业调度优化问题，考虑船舶到港时间、货物装卸需求、岸桥作业能力及碳排放成本等关键因素，构建最小化碳排放成本和码头运营成本的作业调度优化模型，并提出一种“双碳”目标下基于改进型非支配排序遗传算法（NSGA-Ⅱ）（E-NSGA-Ⅱ）的港口作业调度优化算法。首先，调整算法的编码策略、种群初始化方法和交叉变异操作；其次，设计不可行解的基因修复算子，并引入自适应交叉与变异概率机制。实验结果表明，与FCFS （First Come First Service）调度算法相比，所提算法在模型求解中的总成本下降了7.9%，碳排放成本下降了19.7%，码头运营成本下降了6.5%。以上研究结果丰富了多目标优化算法和港口作业调度理论，并为港口企业实现绿色调度、降低运营成本和提升经济效益提供了有力支持。

多因素柔性作业车间绿色调度的改进进化算法

王建华, 吴传宇, 许莉萍

2025, 45(6): 1954-1962. DOI: 10.11772/j.issn.1001-9081.2024050727

摘要 ( )

HTML ( )

PDF (3269KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对考虑设置与运输时间约束且机器加工速度可变的多因素柔性作业车间绿色调度问题（MFJGSP-STVS），构建以完工时间与能源消耗为优化目标的数学模型，并提出一种改进的多目标进化算法（EMoEA）求解该问题。该算法采用三层整数编码方式，在解码中使用机器空闲时间优先（MIP）规则和开关机策略（TOF）优化目标，利用全局搜索（GS）等启发式规则生成初始种群；为了加快算法收敛，基于非支配分层思想设计一种聚类交叉方式；为防止算法过早收敛而陷入局部最优，采用衍生策略扩散非支配解集，通过基于关键路径的自适应局部搜索策略进一步强化算法探索解空间的能力。仿真实验结果表明，与原始的多目标进化算法相比，EMoEA中的每个设计都有更优的超体积（HV）与逆世代距离（IGD）指标；与非支配排序遗传算法（NSGA-Ⅱ）和混合Jaya（HJaya）算法相比，EMoEA在HV与IGD这2个指标上占据优势，且收敛较快，在大多数实例中都获得最优的目标值。可见，EMoEA性能更好，能有效地解决MFJGSP-STVS，为企业提供高质量的调度方案。

基于高维拟共形映射的三维区域参数化方法

宋媛媛, 潘茂东

2025, 45(6): 1963-1970. DOI: 10.11772/j.issn.1001-9081.2024060850

摘要 ( )

HTML ( )

PDF (2805KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对等几何分析中给定边界条件后构造复杂三维（3D）计算域的高质量参数化问题，提出一种基于高维拟共形映射理论的3D区域参数化方法。该方法的核心是建立一个非线性优化模型，同时描述映射的双射性、角度扭曲和体积扭曲。首先，利用高维拟共形映射理论推导出新的衡量3D空间角度扭曲的公式；其次，在优化模型中引入指数变量和体积常数，利用雅各比矩阵的几何意义，实现在保持映射双射性的同时加入体积扭曲的目标；最后，结合交替方向乘子法（ADMM）框架与L-BFGS （Limited-memory Broyden-Fletcher-Goldfarb-Shanno）方法，将原问题分解为易于处理的子问题并交替求解它们。实验结果表明，所提方法在实验模型上保证了全局双射性；相较于ADMM-LRP （ADMM algorithm for Low-Rank Parameterization），所提方法在正交性上提高了约5.8%；相较于TTS （Tet-To-Spline optimization strategy），所提方法在体积一致性上提高了约34.4%。可见，所提方法能获得高质量的参数化，确保双射性，并减小角度扭曲和体积扭曲。

结合信噪比引导的双分支结构和直方图均衡的低照度图像增强网络

黄颖, 高胜美, 陈广, 刘苏

2025, 45(6): 1971-1979. DOI: 10.11772/j.issn.1001-9081.2024060762

摘要 ( )

HTML ( )

PDF (4842KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对基于深度学习的低照度图像增强（LLIE）技术普遍依赖成对的数据集进行训练的问题，考虑实际应用中配对数据集的获取难度较高及其可能导致网络的泛化能力受限的问题，提出一种结合信噪比（SNR）引导的双分支结构和直方图均衡（HE）的LLIE网络，从而摆脱对配对数据集的依赖。首先，在生成对抗网络（GAN）的框架上，引入卷积神经网络（CNN）和Transformer的双分支结构，并使用SNR图像指导网络自适应地增强图像的不同区域，以有效平衡图像增强和噪声抑制；其次，采用经HE处理的低照度图像约束生成结果，从而显著提升生成图像的纹理细节；最后，在鉴别器部分，结合全局与局部鉴别器确保生成图像与参考图像在分布上的一致性，进一步提高图像的视觉质量。为了验证所提网络的有效性，在LOL与LSRW测试集上进行测试，与包含监督和无监督的10种先进方法进行比较。实验结果表明，在LOL数据集上，所提网络的峰值信噪比（PSNR）为19.15 dB，结构相似性指数（SSIM）为0.705 1，均位列第2名；在LSRW数据集中，所提网络以17.28 dB的PSNR和0.485 7的SSIM分别获得第1名与第2名；具体地，在LSRW数据集上，所提网络的PSNR相较于KinD （Kindling the Darkness）和EnlightenGAN（deep light Enhancement without paired supervision Generative Adversarial Network）方法分别提升了15.7%和9.6%。可见，所提网络与无监督方法和部分有监督方法相比均展现了更优越的性能，且显著提升了生成图像的质量。

基于自适应动态图卷积和无参注意力的点云分类分割方法

李维刚, 李歆怡, 王永强, 赵云涛

2025, 45(6): 1980-1986. DOI: 10.11772/j.issn.1001-9081.2024060878

摘要 ( )

HTML ( )

PDF (2200KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对传统卷积在处理点云时难以精确提取邻域特征信息和有效融合上下文信息的问题，提出一种基于自适应动态图卷积和无参注意力的点云分类分割方法。首先，通过自适应动态图卷积模块（ADGC）学习不同邻域的特征信息，生成自适应卷积核，并更新边缘特征，从而精确提取点云的局部邻域特征；其次，设计残差结构学习点云的空间位置信息，以精确捕获点对之间的几何结构，更好地保留和提取细节特征；最后，为了更好地关注和提取局部几何特征，结合无参注意力模块（PFA）与卷积操作，增强邻域之间的联系和模型的上下文感知能力。实验结果表明，与PointNet相比，所提方法在多种任务上具有显著优势，具体地，所提方法的分类任务的总体精度（OA）提升了4.6个百分点，部件分割任务实例的平均交并比（mIoU）提升了2.3个百分点，语义分割任务的mIoU提升了24.6个百分点。可见，所提方法进一步增强了对复杂几何结构的理解和表征能力，在各种任务中实现了更精确的特征提取和实验性能。

基于RT-DETR的轴承表面微小缺陷检测算法

周得辉, 赵军, 程进峰

2025, 45(6): 1987-1997. DOI: 10.11772/j.issn.1001-9081.2024050691

摘要 ( )

HTML ( )

PDF (6857KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

轴承表面缺陷对机电设备的性能和稳定性有显著影响。针对当前轴承表面缺陷检测过程中存在的小目标识别精度不高、速度较慢的问题，提出一种基于RT-DETR（Real-Time DEtection TRansformer）的轴承表面微小缺陷检测算法——FECS-DETR（Faster Expand and Cross hierarchical-scaled feature Screening DETR）算法。首先，采用轻量级FasterNet-T1重构RT-DETR主干网络以降低计算开销；其次，设计内嵌注意力的扩张残差融合（AERF）模块用于提取深层特征，从而增强对小尺度抽象特征的描述能力；再次，通过引入级联分组注意力（CGA），进一步降低计算冗余，并提升模型的运行效率；继次，提出一种跨层级尺度的信息筛选特征金字塔网络（CIS-FPN），以解决特征融合过程中的信息丢失问题，并增强特征融合能力；最后，利用归一化Wasserstein距离（NWD）与改进Inner-MPDIoU联合的回归损失优化策略提高模型收敛速度和模型检测小尺度目标的准确性。实验结果表明，相较于原RT-DETR算法，FECS-DETR算法在轴承表面微小缺陷数据集上的平均精度均值（mAP）提升了2.5个百分点，计算量减少了28.8%，帧率提升了20.8%。可见，所提算法实现了准确率与实时性之间的平衡，能够满足工业环境下的轴承表面微小缺陷检测需求。

信息瓶颈引导的颅内出血分割方法

蒋杰, 骆功宁, 董素宇, 李凡丁, 李向宇, 李钦策, 袁永峰, 王宽全

2025, 45(6): 1998-2006. DOI: 10.11772/j.issn.1001-9081.2024060855

摘要 ( )

HTML ( )

PDF (2451KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在计算机辅助诊断领域，精确分割计算机断层扫描（CT）图像中的颅内出血（ICH）对后续的治疗和预后至关重要。针对小出血区域难以分割的问题，提出一种信息瓶颈引导的ICH分割方法并基于该方法构建一个信息瓶颈引导的分割网络（IBGS-Net）。首先，采用U-Net架构作为基础，并引入信息瓶颈层增强与ICH分割相关的关键特征的识别；其次，通过设计的残差空间自适应归一化（ResSPADE）模块，信息激活图（IAM）被有效整合到分割流程中，提升网络对出血区域的识别和定位能力；最后，引入交互引导损失（IGL）函数以优化模型对难分割区域的处理，进一步增强模型的泛化性能。在内部数据集上的评估结果表明，所提方法在Dice相似性系数（DSC）、归一化表面Dice（NSD）和相对体积差（RVD）这3个指标上分别达到了78.1%、90.1%和11.5%；在公开数据集INSTANCE 2022上，与其他的分割方法的比较结果表明，所提方法的3个指标相较于次优结果，分别提升了1.9、2.4和下降了3.2个百分点。以上验证了所提方法在ICH分割任务中的有效性和优越性，可用于协助临床医生进行ICH分割。

基于多尺度空间特征的冠状动脉CT血管造影图像分割网络

陈盈涛, 方康康, 张金敖, 梁浩然, 郭焕斌, 邱兆文

2025, 45(6): 2007-2015. DOI: 10.11772/j.issn.1001-9081.2024060853

摘要 ( )

HTML ( )

PDF (2646KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

冠状动脉血管形态结构的复杂性以及计算机断层扫描（CT）血管造影（CTA）图像的采集条件差异会导致图像灰度分布不均匀、运动伪影和噪声等图像质量问题，进而产生冠状动脉结构分割时的漏判和误判问题。因此，提出一种基于多尺度空间特征的冠状动脉CTA图像分割网络——三维多尺度并行网络（MSP-Net）。首先，针对冠状动脉的空间跨度大和局部占比小的特点，采用多尺度网络分别提取冠状动脉CTA图像的全局特征和局部特征并融合它们，保证冠状动脉结构特征的完整提取；其次，冠状动脉重建采用由粗到细的思想，增强图像特征的冗余性，确保冠状动脉的边界分明，再利用不同尺度特征度融合方法重建冠状动脉结构，以提高分割结果的准确率，减少漏判和误判；最后，为了加快网络的训练，采用深监督策略，在不同网络层级上引入监督信号，从而提高训练效率。实验结果表明，所提网络在冠状动脉自动分割任务中的平均Dice相似系数（DSC）达到87.16%，比nnU-Net和Swin UNETR （Swin UNEt TRansformers）分别提高了4.04和2.31个百分点，而平均95%豪斯多夫距离（HD95）达到3.69 mm，比nnU-Net和Swin UNETR分别降低了14.43 mm和13.75 mm。可见，所提网络能有效提高冠状动脉结构的分割精度，有助于临床医生更准确地了解患者冠状动脉结构，从而更有效地评估病情。

改进ConvNeXt的无线胶囊内镜图像分类模型

王向, 崔倩倩, 张晓明, 王建超, 王震洲, 宋佳霖

2025, 45(6): 2016-2024. DOI: 10.11772/j.issn.1001-9081.2024060806

摘要 ( )

HTML ( )

PDF (3776KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对无线胶囊内镜（WCE）图像分类模型存在的仅针对单一疾病或局限于某个特定器官，而难以适应临床需求的问题，提出一种改进ConvNeXt-T（ConvNeXt Tiny）的WCE图像分类模型。首先，在模型特征提取过程中引入简单无参注意力模块（SimAM），使模型关注WCE图像的关键区域，从而精准捕捉病变区域边界和纹理等细节特征；其次，设计全局上下文多尺度特征融合（GC-MFF）模块；先通过全局上下文模块（GC Block）优化模型的全局上下文建模能力，再融合浅层和深层的多尺度特征以获得更具表征能力的WCE图像特征；最后，针对WCE图像类内差异大的问题，优化交叉熵（CE）损失函数。在WCE数据集上的实验结果表明，相较于原始模型ConvNeXt-T，所提模型在准确率和F1值上分别提升了2.96和3.16个百分点；与主流分类模型中性能表现最好的Swin-B （Swin Transformer Base）模型相比，所提模型在参数量上减少了67.4%，在准确率和F1值上分别提升了0.51和0.67个百分点。以上表明所提模型具有更好的分类性能，能有效辅助医生进行准确的消化道疾病诊断。

基于听觉调制孪生网络的单通道语音分离模型

宋源, 陈锌, 李亚荣, 李永伟, 刘扬, 赵振

2025, 45(6): 2025-2033. DOI: 10.11772/j.issn.1001-9081.2024050724

摘要 ( )

HTML ( )

PDF (2813KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为了解决基于语谱图特征输入的单通道语音分离方法存在的不同说话人时频点重叠导致分离效果欠佳的问题，提出一种基于听觉调制孪生网络的单通道语音分离模型。首先，通过频带划分和包络检波计算调制信号，进而利用傅里叶变换提取调制幅度谱；其次，基于突变点检测和匹配的方法获取调制幅度谱特征与语音片段之间的映射关系，实现语音片段的有效划分；再次，设计融合协同注意力机制的孪生神经网络（FCMSNN）提取不同说话人语音片段的鉴别性特征；继次，提出基于邻域机制的自组织映射（N-SOM）网络，通过划定动态邻域范围实现无需预先指定说话人数量的特征聚类，以获得不同说话人的掩膜矩阵；最后，为了避免在调制域重构信号中产生伪影，设计时域滤波器将调制域掩膜转换为时域掩膜并结合相位信息重构语音信号。实验结果表明，所提模型在WSJ0-2mix和WSJ0-3mix数据集上的语音质量感知评价（PESQ）、信号失真比改进（SDRi）和尺度不变信号失真比改进（SI-SDRi）均优于双密度双树复小波变换（DDDTCWT）方法，分别提高了3.47%、6.91%和7.79%和3.08%、6.71%、7.51%。

基于音节类型识别的自动语音分割算法

孙林嘉, 秦磊, 康美金, 王莹琳

2025, 45(6): 2034-2042. DOI: 10.11772/j.issn.1001-9081.2024060748

摘要 ( )

HTML ( )

PDF (1715KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

基于边界检测的方法侧重利用时域和频域的突变来将语音数据切分成音节单元，较少关注语言知识在分割中发挥的作用。同时，此类方法通常需要设置各项参数以获得满意的分割结果，致使这些方法在大数据量和跨语言的环境下存在稳定性差、调整参数难和泛化能力弱的缺点。针对上述问题，提出一种基于音节类型识别的自动语音分割算法。该算法的特点在于所要识别的对象是语音数据中的音节类型，而非具体的音节内容。首先，利用语言学研究成果和音节构成规律获得不同语言在自然发音下较通用的音节类型；其次，采用经典的高斯混合模型（GMM）和隐马尔可夫模型（HMM）为每种音节类型构建声学模型；另外，为了更好地描述音节属性，提出一种基于多频带分析和显著信息融合的特征提取通道；最后，在所识别音节类型序列的基础上，使用维特比算法确定对应音节起止点的语音帧。在实验阶段利用3种常见语言的语音数据训练得到音节类型的声学模型，再在6种语言和方言上进行识别实验。实验结果表明，所提算法的平均识别准确率至少达到了91.93%；与使用梅尔频率倒谱系数（MFCC）相比，使用所提特征获得的平均识别准确率至少提升了27.16个百分点；当容差阈值为20 ms时，在6种语言和方言上依然可以取得90.70%以上的平均分割准确率；相较于近年来有代表性的4种算法，所提算法的平均分割准确率至少提升了5.73个百分点。以上说明所提算法具有较强的泛化能力、较好的稳定性和较高的分割准确率。

当期目录