检索结果

Select

1. 基于音节类型识别的自动语音分割算法

孙林嘉, 秦磊, 康美金, 王莹琳

《计算机应用》唯一官方网站 2025, 45 (6): 2034-2042. DOI: 10.11772/j.issn.1001-9081.2024060748

摘要（26）

HTML （2）

PDF （1715KB）（4）

基于边界检测的方法侧重利用时域和频域的突变来将语音数据切分成音节单元，较少关注语言知识在分割中发挥的作用。同时，此类方法通常需要设置各项参数以获得满意的分割结果，致使这些方法在大数据量和跨语言的环境下存在稳定性差、调整参数难和泛化能力弱的缺点。针对上述问题，提出一种基于音节类型识别的自动语音分割算法。该算法的特点在于所要识别的对象是语音数据中的音节类型，而非具体的音节内容。首先，利用语言学研究成果和音节构成规律获得不同语言在自然发音下较通用的音节类型；其次，采用经典的高斯混合模型（GMM）和隐马尔可夫模型（HMM）为每种音节类型构建声学模型；另外，为了更好地描述音节属性，提出一种基于多频带分析和显著信息融合的特征提取通道；最后，在所识别音节类型序列的基础上，使用维特比算法确定对应音节起止点的语音帧。在实验阶段利用3种常见语言的语音数据训练得到音节类型的声学模型，再在6种语言和方言上进行识别实验。实验结果表明，所提算法的平均识别准确率至少达到了91.93%；与使用梅尔频率倒谱系数（MFCC）相比，使用所提特征获得的平均识别准确率至少提升了27.16个百分点；当容差阈值为20 ms时，在6种语言和方言上依然可以取得90.70%以上的平均分割准确率；相较于近年来有代表性的4种算法，所提算法的平均分割准确率至少提升了5.73个百分点。以上说明所提算法具有较强的泛化能力、较好的稳定性和较高的分割准确率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 改进ConvNeXt的无线胶囊内镜图像分类模型

王向, 崔倩倩, 张晓明, 王建超, 王震洲, 宋佳霖

《计算机应用》唯一官方网站 2025, 45 (6): 2016-2024. DOI: 10.11772/j.issn.1001-9081.2024060806

摘要（18）

HTML （1）

PDF （3776KB）（5）

针对无线胶囊内镜（WCE）图像分类模型存在的仅针对单一疾病或局限于某个特定器官，而难以适应临床需求的问题，提出一种改进ConvNeXt-T（ConvNeXt Tiny）的WCE图像分类模型。首先，在模型特征提取过程中引入简单无参注意力模块（SimAM），使模型关注WCE图像的关键区域，从而精准捕捉病变区域边界和纹理等细节特征；其次，设计全局上下文多尺度特征融合（GC-MFF）模块；先通过全局上下文模块（GC Block）优化模型的全局上下文建模能力，再融合浅层和深层的多尺度特征以获得更具表征能力的WCE图像特征；最后，针对WCE图像类内差异大的问题，优化交叉熵（CE）损失函数。在WCE数据集上的实验结果表明，相较于原始模型ConvNeXt-T，所提模型在准确率和F1值上分别提升了2.96和3.16个百分点；与主流分类模型中性能表现最好的Swin-B （Swin Transformer Base）模型相比，所提模型在参数量上减少了67.4%，在准确率和F1值上分别提升了0.51和0.67个百分点。以上表明所提模型具有更好的分类性能，能有效辅助医生进行准确的消化道疾病诊断。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 信息瓶颈引导的颅内出血分割方法

蒋杰, 骆功宁, 董素宇, 李凡丁, 李向宇, 李钦策, 袁永峰, 王宽全

《计算机应用》唯一官方网站 2025, 45 (6): 1998-2006. DOI: 10.11772/j.issn.1001-9081.2024060855

摘要（34）

HTML （0）

PDF （2451KB）（5）

在计算机辅助诊断领域，精确分割计算机断层扫描（CT）图像中的颅内出血（ICH）对后续的治疗和预后至关重要。针对小出血区域难以分割的问题，提出一种信息瓶颈引导的ICH分割方法并基于该方法构建一个信息瓶颈引导的分割网络（IBGS-Net）。首先，采用U-Net架构作为基础，并引入信息瓶颈层增强与ICH分割相关的关键特征的识别；其次，通过设计的残差空间自适应归一化（ResSPADE）模块，信息激活图（IAM）被有效整合到分割流程中，提升网络对出血区域的识别和定位能力；最后，引入交互引导损失（IGL）函数以优化模型对难分割区域的处理，进一步增强模型的泛化性能。在内部数据集上的评估结果表明，所提方法在Dice相似性系数（DSC）、归一化表面Dice（NSD）和相对体积差（RVD）这3个指标上分别达到了78.1%、90.1%和11.5%；在公开数据集INSTANCE 2022上，与其他的分割方法的比较结果表明，所提方法的3个指标相较于次优结果，分别提升了1.9、2.4和下降了3.2个百分点。以上验证了所提方法在ICH分割任务中的有效性和优越性，可用于协助临床医生进行ICH分割。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于自适应动态图卷积和无参注意力的点云分类分割方法

李维刚, 李歆怡, 王永强, 赵云涛

《计算机应用》唯一官方网站 2025, 45 (6): 1980-1986. DOI: 10.11772/j.issn.1001-9081.2024060878

摘要（29）

HTML （0）

PDF （2200KB）（8）

针对传统卷积在处理点云时难以精确提取邻域特征信息和有效融合上下文信息的问题，提出一种基于自适应动态图卷积和无参注意力的点云分类分割方法。首先，通过自适应动态图卷积模块（ADGC）学习不同邻域的特征信息，生成自适应卷积核，并更新边缘特征，从而精确提取点云的局部邻域特征；其次，设计残差结构学习点云的空间位置信息，以精确捕获点对之间的几何结构，更好地保留和提取细节特征；最后，为了更好地关注和提取局部几何特征，结合无参注意力模块（PFA）与卷积操作，增强邻域之间的联系和模型的上下文感知能力。实验结果表明，与PointNet相比，所提方法在多种任务上具有显著优势，具体地，所提方法的分类任务的总体精度（OA）提升了4.6个百分点，部件分割任务实例的平均交并比（mIoU）提升了2.3个百分点，语义分割任务的mIoU提升了24.6个百分点。可见，所提方法进一步增强了对复杂几何结构的理解和表征能力，在各种任务中实现了更精确的特征提取和实验性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 多因素柔性作业车间绿色调度的改进进化算法

王建华, 吴传宇, 许莉萍

《计算机应用》唯一官方网站 2025, 45 (6): 1954-1962. DOI: 10.11772/j.issn.1001-9081.2024050727

摘要（16）

HTML （3）

PDF （3269KB）（0）

针对考虑设置与运输时间约束且机器加工速度可变的多因素柔性作业车间绿色调度问题（MFJGSP-STVS），构建以完工时间与能源消耗为优化目标的数学模型，并提出一种改进的多目标进化算法（EMoEA）求解该问题。该算法采用三层整数编码方式，在解码中使用机器空闲时间优先（MIP）规则和开关机策略（TOF）优化目标，利用全局搜索（GS）等启发式规则生成初始种群；为了加快算法收敛，基于非支配分层思想设计一种聚类交叉方式；为防止算法过早收敛而陷入局部最优，采用衍生策略扩散非支配解集，通过基于关键路径的自适应局部搜索策略进一步强化算法探索解空间的能力。仿真实验结果表明，与原始的多目标进化算法相比，EMoEA中的每个设计都有更优的超体积（HV）与逆世代距离（IGD）指标；与非支配排序遗传算法（NSGA-Ⅱ）和混合Jaya（HJaya）算法相比，EMoEA在HV与IGD这2个指标上占据优势，且收敛较快，在大多数实例中都获得最优的目标值。可见，EMoEA性能更好，能有效地解决MFJGSP-STVS，为企业提供高质量的调度方案。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 基于均匀流型逼近与投影的高级加密标准算法相关功耗分析方法

张润莲, 唐瑞锋, 王蒿, 武小年

《计算机应用》唯一官方网站 2025, 45 (6): 1895-1901. DOI: 10.11772/j.issn.1001-9081.2024060867

摘要（38）

HTML （2）

PDF （4616KB）（11）

侧信道攻击（SCA）中所采集的能量迹数据的高噪声和高维度大幅降低了SCA的效率和密钥恢复的准确率。针对上述问题，提出一种基于均匀流型逼近与投影（UMAP）的高级加密标准（AES）算法相关功耗分析（CPA）方法。所提方法基于欧氏距离计算能量迹数据的邻近点集合。首先，通过构建邻接图并计算邻近点之间的相似度得到加权邻接图，从而捕获能量迹数据之间的位置关系以保留数据的局部结构特征；其次，利用拉普拉斯矩阵描述邻接图的结构关系，并通过特征分解取特征值较小的特征向量作为初始化的低维数据；同时，为了保留数据的全局结构特征，使用二进制交叉熵作为优化函数调整数据在低维空间中的位置；此外，为了提升计算效率，在梯度下降过程中使用力导向图布局算法；最后，对降维后的数据进行相关功耗攻击以恢复密钥。实验结果表明，UMAP方法能够有效保留原始能量迹数据的局部和全局结构特征；所提方法能够提高能量迹数据和假设功耗泄露模型之间的相关性，减少恢复密钥所需的能量迹条数，具体地，所提方法恢复单个密钥字节需要的能量迹条数为180，恢复全部16个密钥字节需要的能量迹条数为700；相较于等距特征映射（ISOMAP）降维方法，所提方法恢复所有密钥字节所需的能量迹条数减少了36.4%。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

7. 基于风味嵌入异构图层次学习的食谱推荐模型

颜文婧, 王瑞东, 左敏, 张青川

《计算机应用》唯一官方网站 2025, 45 (6): 1869-1878. DOI: 10.11772/j.issn.1001-9081.2024060859

摘要（83）

HTML （3）

PDF （2465KB）（19）

针对食谱推荐任务中信息维度不全面、交互数据稀疏和交互信息冗余的问题，提出一种基于风味嵌入异构图层次学习的食谱推荐模型（RecipeFlavor）。首先，引入风味分子维度，并基于用户、食物、食材和食材的风味物质构建异构图，有效表示4种节点之间的联系；其次，基于信息传递机制构建基于异构图的层级学习模块，并结合压缩注意力（SA）机制，将节点的不同关系视为不同的信息通道，提取节点之间的关键交互信息并抑制噪声；最后，基于特征感知噪声构建对比学习（CL）模块，在模型学习中引入正负样本区分任务，增强用户和食谱节点之间的信息关联，提升模型对特征的学习能力。实验结果表明，RecipeFlavor在Recipe 1M+大型数据集上，与HGAT（Hierarchical Graph ATtention network for recipe recommendation）模型相比，曲线下面积（AUC）提升了1.44个百分点，Top-10的模型精确度（Pre）、命中率（HR）、平均精度（MAP）和归一化折损累计增益（NDCG）分别提升了0.76、6.11、2.68和3.05个百分点。可见，风味分子信息的引入拓展了食谱推荐的学习维度，而RecipeFlavor能有效提取异构图中的关键信息，增强用户和食谱之间的关联性，从而提升食谱推荐的精度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

8. 基于代码生成的细粒度情感分析方法

帅健, 王中卿, 陈嘉沥

《计算机应用》唯一官方网站 2025, 45 (6): 1827-1832. DOI: 10.11772/j.issn.1001-9081.2024060885

摘要（31）

HTML （1）

PDF （1029KB）（11）

细粒度情感分析（ABSA）任务越来越受到人们的关注。针对目前主流的ABSA方法无法充分利用语义关系且无法充分学习各情感元素之间联系的局限，提出一种基于代码生成的ABSA方法。首先，对应各情感元素与编程语言（PL）；其次，按照对应原则将实验数据集构造成代码生成任务的数据样式，代码样式可以更好地表达各情感元素之间的联系；最后，利用当前大语言模型（LLM）的强大性能及代码生成方法在事件抽取任务上的良好表现得到更准确的结果。为了验证所提方法的有效性，使用Paraphrase、Seq2Path和意见树生成（OTG）方法进行对比实验。实验结果表明，所提方法在ABSA任务中的餐厅数据集上F1分数比OTG方法高2.82个百分点，具有更好的效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

9. 基于实体表示增强的文档级关系抽取

王海杰, 张广鑫, 史海, 陈树

《计算机应用》唯一官方网站 2025, 45 (6): 1809-1816. DOI: 10.11772/j.issn.1001-9081.2024050682

摘要（26）

HTML （2）

PDF （1555KB）（22）

针对现有的文档级关系抽取（DocRE）任务的实体表示学习存在的忽视实体提及差异性和缺少实体对关系抽取复杂度的计算范式的问题，提出一种基于实体表示增强的DocRE模型（DREERE）。首先，利用注意力机制评估实体提及在判定不同实体对关系时的差异性，得到更灵活的实体表示；其次，利用编码器计算得到的实体对句子重要性分布评估实体对关系抽取的复杂度，再选择性地利用实体对之间的两跳信息增强实体对的表示；最后，在3个流行的数据集DocRED、Re-DocRED和DWIE上进行实验。结果显示，与最优基线模型（如ATLOP（Adaptive Thresholding and Localized cOntext Pooling）、E2GRE（Entity and Evidence Guided Relation Extraction））相比，DREERE的F1值分别提高了0.06、0.14和0.23个百分点，忽略训练集出现的三元组而计算得到的F1分数（ign-F1）值分别提高了0.07、0.09和0.12个百分点，可见该模型能够有效获取文档里的实体语义信息。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

10. 基于区块链的数字内容版权保护和公平追踪方案

王利娥, 林彩怡, 李永东, 傅星珵, 李先贤

《计算机应用》唯一官方网站 2025, 45 (6): 1756-1765. DOI: 10.11772/j.issn.1001-9081.2024060901

摘要（61）

HTML （2）

PDF （3016KB）（11）

针对数字内容版权保护和追踪过程中的版权所有者恶意诬陷购买者，以及购买者知道自己的水印而进行去水印操作的问题，提出一种基于区块链的数字内容版权保护和公平追踪方案。首先，使用Paillier同态加密算法和密钥分发智能合约更改密文状态下购买者水印，并将水印嵌入加密的数字内容；其次，通过区块链中的验证节点调用密钥分发智能合约和仲裁智能合约，解决传统版权保护方案存在的单点故障问题；最后，通过实验验证所提方案的性能。结果表明，所提方案在数字内容尺寸（像素×像素）为1 024×1 024时，相较于针对垂直行业服务信息泄露的区块链问责机制，所提方案加密和嵌入水印的总时间减少了94.92%，总解密时间减少了79.72%。可见，所提方案的总时间和运行成本低，具有良好的运行效率，能够广泛用于数字内容版权保护领域。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

11. 融合时序行为链与事件类型的类案检索方法

詹力林, 秦永彬, 黄瑞章, 王华, 陈艳平

《计算机应用》唯一官方网站 2025, 45 (6): 1741-1747. DOI: 10.11772/j.issn.1001-9081.2024070917

摘要（35）

HTML （2）

PDF （1642KB）（14）

针对现有的类案检索（LCR）方法缺乏对案情要素的有效利用而容易被案例内容的语义结构相似性误导的问题，提出一种融合时序行为链与事件类型的类案检索方法。首先，采取序列标注的方法识别案情描述中的法律事件类型，并利用案例文本中的行为要素构建时序行为链，以突出案情的关键要素，从而使模型聚焦于案例的核心内容，进而解决现有方法易被案例内容的语义结构相似性误导的问题；其次，利用分段编码构造时序行为链的相似性向量表征矩阵，从而增强案例间行为要素的语义交互；最后，通过聚合评分器，从时序行为链、法律事件类型、犯罪类型这3个角度衡量案例的相关性，从而增加案例匹配得分的合理性。实验结果表明，相较于SAILER（Structure-Aware pre-traIned language model for LEgal case Retrieval）方法，所提方法在LeCaRD（Legal Case Retrieval Dataset）上的P@5值提升了4个百分点、P@10值提升了3个百分点、MAP值提升了4个百分点，而NDCG@30值提升了0.8个百分点。可见，该方法能有效利用案情要素来避免案例内容的语义结构相似性的干扰，并能为类案检索提供可靠的依据。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

12. 面向低能耗高性能的分类器两阶段数据选择方法

崔双双, 王宏志, 朱加昊, 吴昊

《计算机应用》唯一官方网站 2025, 45 (6): 1703-1711. DOI: 10.11772/j.issn.1001-9081.2024060883

摘要（47）

HTML （7）

PDF （2107KB）（15）

针对利用海量数据构建分类模型时训练数据规模大、训练时间长且碳排放量大的问题，提出面向低能耗高性能的分类器两阶段数据选择方法TSDS （Two-Stage Data Selection）。首先，通过修正余弦相似度确定聚类中心，并将样本数据进行基于不相似点的分裂层次聚类；其次，对聚类结果按数据分布自适应抽样以组成高质量的子样本集；最后，利用子样本集在分类模型上训练，在加速训练过程的同时提升模型精度。在Spambase、Bupa和Phoneme等6个数据集上构建支持向量机（SVM）和多层感知机（MLP）分类模型，验证TSDS的性能。实验结果表明在样本数据压缩比达到85.00%的情况下，TSDS能将分类模型准确率提升3~10个百分点，同时加速模型训练，使训练SVM分类器的能耗平均降低93.76%，训练MLP分类器的能耗平均降低75.41%。可见，TSDS在大数据场景的分类任务上既能缩短训练时间和减少能耗，又能提升分类器性能，从而助力实现“双碳”目标。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

13. 基于单目视觉输电线路精细化巡检方法

王文帅, 韩军, 胡广怡, 陈炣燏

《计算机应用》唯一官方网站 2025, 45 (5): 1694-1702. DOI: 10.11772/j.issn.1001-9081.2024050632

摘要（34）

HTML （2）

PDF （5700KB）（17）

针对当前输电线路等空中人造目标的无人机（UAV）精细化巡检轨迹生成方法繁琐、精度不高以及未能以最佳角度拍摄人造目标局部细节等问题，提出一种可以用于输电线路的UAV精细化巡检的实时深度感知与实时线路部件分割定位算法，并构建输电线路单目视觉感知定位导航的最优巡检点路径。通过实时量化调整巡检过程中UAV位置与云台相机拍摄角度，该方法既保证UAV巡检时始终保持安全巡检距离，又使得云台相机能够清晰准确地拍摄包含待巡检目标的图像。采用大疆UAV采集的真实输电线路图像数据和Unreal Engine 4（虚幻引擎）场景下的输电线路图像数据进行实验仿真验证。结果表明，优化的深度感知算法与线路部件分割定位算法能够满足实时性要求。在深度感知与分割定位输出信息的指导下，这些算法能够将UAV位置和云台相机姿态调整为最佳，进而获得高质量的输电线路UAV巡检图像，且最终生成的输电线路精细化巡检轨迹能显著提高运维人员的巡检效率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

14. 融合空间-傅里叶域信息的机器人低光环境抓取检测

陈路, 王怀瑶, 刘京阳, 闫涛, 陈斌

《计算机应用》唯一官方网站 2025, 45 (5): 1686-1693. DOI: 10.11772/j.issn.1001-9081.2024111686

摘要（58）

HTML （1）

PDF （2948KB）（16）

针对现有抓取检测方法无法有效感知稀疏、微弱特征，导致低光环境下机器人抓取检测性能下降的问题，提出一种融合空间-傅里叶域信息的机器人低光环境抓取检测方法。首先，该方法的骨干网络采用编-解码器结构，在网络深层特征与浅层特征融合过程中进行空间域-傅里叶域的特征提取。具体地，在空间域中通过水平和垂直方向的条带卷积捕获全局上下文信息，提取对抓取检测任务敏感的特征；在傅里叶域中分别调整振幅和相位，实现对图像细节和纹理特征的恢复。其次，引入R-CoA（Row-Column Attention）模块平衡图像全局与局部信息，并对图像进行行、列相对位置编码以强化与抓取任务相关的位置信息。最后，在低光Cornell、低光Jacquard以及所构建的低光C?Cornell数据集上分别进行验证，所提低光抓取检测方法最高准确率分别达到96.62%、92.01%和95.50%。在低光Cornell数据集（高斯噪声且γ=1.5）上，与GR-ConvNetv2（Generative Residual Convolutional Neural Network v2）、SE?ResUNet（Squeeze-and-Excitation ResUNet）相比，所提方法的准确率分别提升2.24个百分点和1.12个百分点。所提方法能够在低光环境下有效提升抓取检测的鲁棒性和准确性，为机器人在低光照条件下的抓取任务提供支持。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

15. 工业缺陷检测无监督深度学习方法综述

王文鹏, 秦寅畅, 师文轩

《计算机应用》唯一官方网站 2025, 45 (5): 1658-1670. DOI: 10.11772/j.issn.1001-9081.2024050736

摘要（89）

HTML （1）

PDF （3241KB）（282）

工业缺陷检测在保障产品质量、提高企业竞争力方面具有极其重要的作用。传统的缺陷检测方法依赖人工检查，成本高且效率低下，难以满足大规模的质量检验需求。近年来，基于视觉的工业缺陷检测技术取得了显著进步，已成为产品外观质量检验的一种高效解决方案。但在许多实际工业场景中，获取大量带有标签的数据非常困难，且对产品检测的人工成本和实时性均有所要求，因此，无监督学习逐渐成为研究的热点。针对该领域任务构建、现行技术、评估标准以及不同方法之间的共性和差异，对相关工作进行综述。首先，明确工业缺陷问题的定义，并从数据难点和任务挑战等多个角度分析该问题的难点；其次，重点介绍基于无监督深度学习的工业缺陷检测主流方法，并对它们进行详细的归纳与分析；再次，介绍常用的公开数据集与评价指标；最后，对工业缺陷检测领域将来的工作进行展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

16. 基于超大规模多输入多输出系统的快速波束训练

王华华, 谢长江, 方杰宁

《计算机应用》唯一官方网站 2025, 45 (5): 1625-1631. DOI: 10.11772/j.issn.1001-9081.2024050583

摘要（45）

HTML （0）

PDF （2429KB）（10）

超大规模多输入多输出（XL-MIMO）系统能显著提高信道容量。然而，传统的均匀线性阵列（ULA）在大入射角/出射角下，近场区域会急剧缩小，导致信号覆盖受限。使用均匀圆形阵列（UCA）可以有效扩大近场区域，但这也使得基于ULA的低开销波束训练方案不再适用。为了减少UCA近场波束训练的开销，提出一种新的快速波束训练方案：在第一阶段将UCA近似为ULA，使用ULA联合的方式构建远场分层码本进行角度域的用户搜索；在第二阶段，基于第一阶段搜索得到的角度，使用UCA进行角度与距离的穷举搜索。仿真结果表明，在天线数为512的UCA系统中，该方案仅需28个训练开销，并且在不同信噪比（SNR）条件下具有较好的鲁棒性，平均速率性能达到速率基准的99.16%。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

17. 基于深度学习的智能反射面辅助通信系统信道估计

王丹, 张文豪, 彭丽娟

《计算机应用》唯一官方网站 2025, 45 (5): 1613-1618. DOI: 10.11772/j.issn.1001-9081.2024050587

摘要（64）

HTML （2）

PDF （2736KB）（262）

针对智能反射面（RIS）辅助通信系统中信道估计精度低的问题，提出一种基于信道去噪网络（CDN）的信道估计方案，将信道估计问题建模为信道噪声消除的问题。首先使用传统算法对接收到的导频信号进行初步预估计，随后将该预估计信号输入信道估计网络以学习噪声特征并进行去噪处理，从而恢复出精确的信道系数。为了提高网络的去噪能力，设计了加权注意力块（WAB）和膨胀卷积块（DCB）以增强网络对噪声主体特征的提取，同时设计多尺度特征融合模块以防止浅层特征的丢失。仿真结果表明，与经典的DnCNN （Denoising Convolutional Neural Network）和CDRN （Convolutional neural network-based Deep Residual Network）方案相比，所提方案的归一化均方误差（NMSE）在不同信噪比（SNR）下平均降低了2.89 dB和2.01 dB。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

18. 两阶段填充采样的半监督昂贵多目标优化算法

谭瑛, 任新宇, 孙超利, 王思思

《计算机应用》唯一官方网站 2025, 45 (5): 1605-1612. DOI: 10.11772/j.issn.1001-9081.2024050585

摘要（63）

HTML （0）

PDF （1322KB）（13）

利用计算成本低廉的代理模型替换昂贵目标函数评价，以辅助进化算法对昂贵黑盒多目标优化问题的求解，近年来受到广泛关注。模型的准确度在代理模型辅助的多目标进化算法（MOEA）中发挥着重要作用，特别是当目标函数数量较多时，不准确的模型很容易引导算法朝错误的方向搜索；但目标函数评价昂贵，很难获得充裕的样本训练高质量的代理模型。因此，提出一种两阶段填充采样的半监督昂贵多目标优化算法（TISS-EMOA）。该算法引入半监督技术，选择部分无标签数据扩充训练数据集，从而提升模型的准确性；同时，提出两阶段选点的填充采样准则，以期在评价次数有限的情况下获得昂贵多目标优化问题的较优解集。为验证TISS-EMOA的有效性，在DTLZ1~DTLZ7基准测试问题以及车辆正面结构优化设计上进行了实验。与当前具有代表性的5种代理模型辅助进化多目标算法的对比结果显示，TISS-EMOA在28个基准测试问题中获得了25、28、28、24、23个更好或相当的改进的反转世代近距离（IGD⁺）。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

19. 用于交通流量预测的多图扩散注意力网络

王泉, 陆啟想, 施珮

《计算机应用》唯一官方网站 2025, 45 (5): 1472-1479. DOI: 10.11772/j.issn.1001-9081.2024050636

摘要（45）

HTML （1）

PDF （2668KB）（42）

当前基于时空特征提取的交通流量预测方法中存在挖掘全局空间相关性与长期的动态时间依赖关系能力不足的问题，其中空间相关性的挖掘很大程度上取决于图结构的质量，为此提出一种多图扩散注意力网络（MGDAN），主要包括多图扩散注意力模块（MGDAM）和时间注意力模块。首先，使用自适应时空嵌入生成器构建动态的时空信息；其次，采用最大互信息系数（MIC）矩阵与自适应矩阵挖掘细粒度的空间信息，并利用全局空间注意力机制挖掘动态的空间相关性；最后，使用时间注意力模块提取非线性的时间相关性，并通过3个模块的结合实现时空相关性的有效提取。在PEMS08数据集上的实验结果表明，MGDAN在1 h内的平均绝对误差（MAE）相较于时空自编码器（ST_AE）和时空身份信息（STID）模型分别降低了19.34%和5.74%，且整体预测性能均优于9个基线模型，能够精准地进行中长期交通流量预测，为城市交通疏导提供理论依据。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

20. 基于Swin Transformer的生成对抗网络水下图像增强模型

李慧, 贾炳志, 王晨曦, 董子宇, 李纪龙, 仲兆满, 陈艳艳

《计算机应用》唯一官方网站 2025, 45 (5): 1439-1446. DOI: 10.11772/j.issn.1001-9081.2024050730

摘要（70）

HTML （3）

PDF （3642KB）（40）

针对水下图像对比度低、噪声大和存在色彩偏差等问题，以生成对抗网络（GAN）为核心框架，提出一种基于Swin Transformer的生成对抗网络水下图像增强模型SwinGAN（GAN based on Swin Transformer）。首先，生成网络部分遵循编码器-瓶颈层-解码器的结构设计，在瓶颈层将输入的特征图分割成多个不重叠的局部窗口；其次，引入双路窗口多头自注意力机制（DWMSA），在加强捕获全局信息和长距离依赖关系的同时，增强局部注意力；最后，在解码器中将下采样后的特征图经过多个上采样窗口重新组合成原始尺寸的特征图，判别网络则采用马尔可夫判别器。实验结果表明，与URSCT-SESR模型相比，在UFO-120数据集上，SwinGAN的峰值信噪比（PSNR）提升了0.837 2 dB，结构相似度（SSIM）提高了0.003 6；在EUVP-515数据集上，SwinGAN的PSNR提升了0.843 9 dB，SSIM提高了0.005 1，水下图像质量评价指标（UIQM）增加了0.112 4，水下彩色图像质量评估指标（UCIQE）略有上升，增加了0.001 0。可见，SwinGAN的主观评价以及客观评价指标都表现出色，在改善水下图像的色彩偏差问题上取得了不错的效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

21. 基于带约束谱聚类的启发式车辆路径规划算法优化方法

罗蒙, 高超, 王震

《计算机应用》唯一官方网站 2025, 45 (5): 1387-1394. DOI: 10.11772/j.issn.1001-9081.2024060882

摘要（75）

HTML （11）

PDF （1514KB）（37）

针对现有启发式算法在解决大规模多车场车辆路径规划问题（MDVRP）时存在的初始解质量较差的缺点，提出一种基于带约束谱聚类（CSC）的启发式车辆路径规划算法优化方法。首先，根据待配送客户点的地理位置和需求量生成配送点的地理信息特征矩阵和需求信息特征矩阵；其次，根据地理信息特征矩阵和需求信息特征矩阵生成CSC的约束矩阵，并完成聚类操作；最后，使用谱聚类的结果生成启发式算法的初始解，选择合适的启发式算法完成车辆路径规划问题（VRP）的求解。在标准数据集的21个算例上的实验结果显示，CSC相较于SCSC（Self-Constrained-Spectral-Clustering）在标准化互信息（NMI）和Fowlkes-Mallows指数（FMI）上分别提升了18.75%和31.18%；在车辆路径规划任务中，使用CSC进行初始化的启发式算法在21个不同规模算例中的16个算例上求得了最短路径，并且启发式算法的运行时间相较于使用SCSC缩短了13.05%。实验结果表明，CSC能够有效提高客户点的聚类精度，进而能够有效提高VRP的求解速度和解的精度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

22. 基于记忆型饱和控制器的非线性时滞系统的稳定性分析

葛超, 叶水清, 王红, 姚征

《计算机应用》唯一官方网站 2025, 45 (4): 1349-1355. DOI: 10.11772/j.issn.1001-9081.2024030406

摘要（80）

HTML （2）

PDF （1231KB）（13）

针对在记忆型饱和控制器的作用下，研究非线性时滞系统的指数稳定性问题。首先，考虑系统参数不稳定的因素；其次，利用包含分布式时滞项辅助反馈的多面体方法处理饱和非线性；同时，建立增广Lyapunov-Krasovskii泛函，并利用改进的积分不等式放缩积分项，从而导出基于线性矩阵不等式（LMI）的稳定性准则；此外，制定保守性较低的吸引域优化方案，以提高吸引域的上界；最后，通过一个仿真实例证明所提方案的有效性和实用性。实验结果表明，在非线性系统中，在相同的参数条件下，与无记忆型控制器的现有的吸引域优化方案相比，所提有记忆型控制器的吸引域优化方案具有较低的保守性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

23. 多尺度2D-Adaboost的中药材粉末显微图像识别算法

王一丁, 王泽浩, 李耀利, 蔡少青, 袁媛

《计算机应用》唯一官方网站 2025, 45 (4): 1325-1332. DOI: 10.11772/j.issn.1001-9081.2024040438

摘要（70）

HTML （2）

PDF （3858KB）（127）

针对中药材粉末的显微图像中含有大量细微特征和背景干扰因素导致的同一类药材的变化过大（类内差异大）和多种药材之间特征过于相似（类间差异小）的问题，提出一种多尺度2D-Adaboost算法。首先，构建一个全局?局部特征融合的主干网络架构，以更好地提取多尺度特征，该架构通过结合Transformer和卷积神经网络（CNN）的优势能有效提取并融合各个尺度的全局和局部特征，从而显著提高主干网络的特征捕捉能力；其次，将Adaboost的单尺度输出拓展到多尺度，并构建2D-Adaboost结构的背景抑制模块，该模块将主干网络各个尺度的输出特征图划分为前景和背景，从而有效抑制背景区域的特征值，并增加判别性特征的强度；最后，在2D-Adaboost结构的每个尺度上额外添加一个分类器以构建特征细化模块，该模块通过控制温度参数协调分类器间的协作学习，从而逐步细化不同尺度的特征图，帮助网络学习更合适的特征尺度，并丰富细节特征的表示。实验结果表明，所提算法的识别准确率达到了96.85%，与ConvNeXt-L、ViT-L、Swin-L和Conformer-L模型相比分别上升了7.56、5.26、3.79和2.60个百分点。高准确率和分类效果的稳定性验证了所提算法在中药材粉末显微图像分类任务中的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

24. 结合注意力机制和多尺度特征融合的三维手部姿态估计

郭诗月, 党建武, 王阳萍, 雍玖

《计算机应用》唯一官方网站 2025, 45 (4): 1293-1299. DOI: 10.11772/j.issn.1001-9081.2024040507

摘要（73）

HTML （0）

PDF （2747KB）（24）

针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题，提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先，提出结合扩张卷积和CBAM （Convolutional Block Attention Module）注意力机制的感受强化模块（SEM），以替换沙漏网络（HGNet）中的基本块（Basicblock），在扩大感受野的同时增强对空间信息的敏感性，从而提高手部特征的提取能力；其次，设计一种结合SPCNet （Spatial Preserve and Content-aware Network）和Soft-Attention改进的多尺度信息融合模块SS-MIFM （SPCNet and Soft-attention-Multi-scale Information Fusion Module），在充分考虑空间内容感知机制的情况下，有效地聚合多级特征，并显著提高二维手部关键点检测的准确性；最后，利用2.5D姿态转换模块将二维姿态转换为三维姿态，从而避免二维关键点坐标直接回归计算三维姿态信息导致的空间丢失问题。实验结果表明，在InterHand2.6M数据集上，所提算法的双手关节点平均误差（MPJPE）、单手MPJPE和根节点平均误差（MRRPE）分别达到了12.32、9.96和29.57 mm；在RHD（Rendered Hand pose Dataset）上，与InterNet和QMGR-Net算法相比，所提算法的终点误差（EPE）分别降低了2.68和0.38 mm。以上结果说明了所提算法能够更准确地估计手部姿态，且在一些双手交互和遮挡的场景下有更高的鲁棒性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

25. 基于扩张重参数化和空洞卷积架构的步态识别方法

霍丽娜, 薛乐仁, 戴钰俊, 赵新宇, 王世行, 王威

《计算机应用》唯一官方网站 2025, 45 (4): 1285-1292. DOI: 10.11772/j.issn.1001-9081.2024050566

摘要（110）

HTML （0）

PDF （1928KB）（151）

步态识别旨在通过人们的步行姿态进行身份识别。针对步态识别中有效感受野（ERF）与人体轮廓区域匹配不佳的问题，提出一种基于空洞卷积的步态识别方法DilatedGait。首先，采用空洞卷积扩大神经元感受野，缓解下采样和模型深度增加导致的分辨率下降，以提高轮廓结构的辨识度；其次，提出扩张重参数化模块（DRM），通过重参数化方法融合多尺度卷积核参数，优化ERF聚焦范围，使模型捕获更多的全局上下文信息；最后，通过特征映射提取判别性步态特征。在户外数据集Gait3D和GREW上的实验结果表明，对比目前的先进方法GaitBase，DilatedGait在Gait3D的Rank-1和平均逆负惩罚（mINP）上分别提升了9.0和14.2个百分点，在GREW的Rank-1和Rank-5上分别提升了11.6和8.8个百分点。可见，DilatedGait消除了复杂协变量带来的不利影响，能进一步提升户外场景下步态识别的准确率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

26. 基于零信任的网络数据安全保护框架与实现

王作广, 李超, 赵利

《计算机应用》唯一官方网站 2025, 45 (4): 1232-1240. DOI: 10.11772/j.issn.1001-9081.2024040526

摘要（89）

HTML （2）

PDF （3893KB）（39）

为解决网络架构复杂化、动态化和碎片化演变导致的边界防护措施失效，应对非自主可控的系统、软硬件和密码算法不断呈现的脆弱性对网络数据安全造成的挑战，首先，基于零信任理念设计一个零信任网络架构实现模型；其次，提出一种零信任网络安全保护框架，在身份管理与认证、授权与访问、数据处理与传输等环节融合利用零信任安全理念、国密算法体系和可信计算技术，设计国密证书申请与签发、业务数据安全处理与传输等框架流程，并设计与实现身份与访问管理模块、终端可信网络访问代理设备等功能组件；最后，构建基于安全保护框架的网络平台，从而为网络数据安全保护和零信任安全实践提供新框架、技术和工具。安全分析与性能测试的结果显示，所提平台对SM2的签名与验签性能分别平均达到了每秒1 118.72次和每秒441.43次，对SM4的加密和解密性能分别平均达到了10.05 MB/s和9.96 MB/s，平台数据安全访问/响应性能为7.23 MB/s，表明所提框架可以提供稳定的数据安全支持。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

27. 基于协作贡献网络的开源项目开发者推荐

游兰, 张雨昂, 刘源, 陈智军, 王伟, 曾星, 何张玮

《计算机应用》唯一官方网站 2025, 45 (4): 1213-1222. DOI: 10.11772/j.issn.1001-9081.2024040454

摘要（77）

HTML （2）

PDF （4564KB）（13）

面向开源项目推荐开发人员对开源生态建设具有重要意义。区别于传统软件开发，开源领域的开发者、项目、组织及相互关系体现了开放式协作项目的特点，而它们蕴含的语义有助于精准推荐开源项目的开发者。因此，提出一种基于协作贡献网络（CCN）的开发者推荐（DRCCN）方法。首先，利用开源软件（OSS）开发者、OSS项目、OSS组织之间的贡献关系构建CCN；其次，基于CCN构建一个3层深度的异构GraphSAGE （Graph SAmple and aggreGatE）图神经网络（GNN）模型，预测开发者节点和开源项目节点之间的链接，从而产生相应的嵌入对；最后，根据预测结果，采用K最近邻（KNN）算法完成开发者推荐。在GitHub数据集上训练和测试模型的实验结果表明，相较于序列推荐的对比学习模型CL4SRec （Contrastive Learning for Sequential Recommendation），DRCCN在精确率、召回率和F1值这3个指标上分别提升了约10.7%、2.6%和4.2%。因此，所提模型可以为开源社区项目的开发者推荐提供重要的参考依据。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

28. 基于多视角学习的图神经网络群组推荐模型

王聪, 史艳翠

《计算机应用》唯一官方网站 2025, 45 (4): 1205-1212. DOI: 10.11772/j.issn.1001-9081.2024030337

摘要（123）

HTML （1）

PDF （2528KB）（94）

针对现有基于图神经网络（GNN）的群组推荐模型难以充分利用显隐式交互信息的问题，提出一种基于多视角学习的GNN群组推荐（GRGM）模型。先根据群组交互数据构造超图、二分图和超图投影图，并针对各个图结构的特性采用相应的GNN提取图节点特征，从而充分表达用户、群组和项目之间的显隐式关系；再提出一种多视角信息融合策略，以获取最终的群组和项目表示。在Mafengwo、CAMRa2011和Weeplaces数据集上的实验结果表明，相较于基线模型ConsRec，GRGM模型的命中率（HR@5、HR@10）和归一化折损累计增益（NDCG@5、NDCG@10）在Mafengwo数据集上分别提升了3.38%、1.96%和3.67%、3.84%，在CAMRa2011数据集上分别提升了2.87%、1.18%和0.96%、1.62%，在Weeplaces数据集上分别提升了2.41%、1.69%和4.35%、2.60%。可见，GRGM模型相较于对比模型具有更好的推荐性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

29. 基于路径和增强三元组文本的开放世界知识推理模型

王利琴, 耿智雷, 李英双, 董永峰, 边萌

《计算机应用》唯一官方网站 2025, 45 (4): 1177-1183. DOI: 10.11772/j.issn.1001-9081.2024030265

摘要（101）

HTML （0）

PDF （838KB）（150）

传统的基于表示学习的知识推理方法只能用于封闭世界的知识推理，有效进行开放世界的知识推理是目前的热点问题。因此，提出一种基于路径和增强三元组文本的开放世界知识推理模型PEOR（Path and Enhanced triplet text for Open world knowledge Reasoning）。首先，使用由实体对间结构生成的多条路径和单个实体周围结构生成的增强三元组，其中路径文本通过拼接路径中的三元组文本得到，而增强三元组文本通过拼接头实体邻域文本、关系文本和尾实体邻域文本得到；其次，使用BERT（Bidirectional Encoder Representations from Transformers）分别编码路径文本和增强三元组文本；最后，使用路径向量和三元组向量计算语义匹配注意力，再使用语义匹配注意力聚合多条路径的语义信息。在3个开放世界知识图谱数据集WN18RR、FB15k-237和NELL-995上的对比实验结果表明，与次优模型BERTRL（BERT-based Relational Learning）相比，所提模型的命中率（Hits@10）指标分别提升了2.6、2.3和8.5个百分点，验证了所提模型的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

30. 基于知识图谱和对话结构的问诊推荐方法

徐春, 吉双焱, 马欢, 孙恩威, 王萌萌, 苏明钰

《计算机应用》唯一官方网站 2025, 45 (4): 1157-1168. DOI: 10.11772/j.issn.1001-9081.2024050573

摘要（88）

HTML （8）

PDF （2938KB）（36）

针对现有的问诊推荐方法未能充分利用医患间丰富的对话信息和无法捕捉患者实时的健康需求和偏好的问题，提出一种基于知识图谱和对话结构的问诊推荐方法（KGDS）。首先，构建包含评论情感分析和医学专业知识的医疗知识图谱（KG），增强医生和患者的细粒度特征表示；其次，在患者表示学习部分，设计一种患者查询编码器，从词级和句级这2个层面提取查询文本的关键特征，并通过注意力机制加强医患向量间的高阶特征交互；再次，建模诊断对话，充分利用医患间丰富的对话信息增强医患特征表示；最后，设计基于对比学习的对话模拟器，捕捉患者的动态需求和实时偏好，利用模拟的对话表示辅助推荐得分的预测。在真实数据集上的实验结果表明，KGDS相较于最优基线方法在曲线下面积（AUC）、平均值倒数秩（MRR@15）、推荐多样性（Diversity@15）、调和平均值（F1@15）、命中率（HR@15）和归一化折损累计增益（NDCG@15）上分别提高了1.82、1.78、3.85、3.06、10.02和4.51个百分点，验证了KGDS的有效性，且可见情感分析和KG的纳入增强了推荐结果的可解释性。

图表 | 参考文献 | 相关文章 | 多维度评价