CCF第36届中国计算机应用大会 (CCF NCCA 2021)

Select

1. 自然语言处理在文本情感分析领域应用综述

王颖洁, 朱久祺, 汪祖民, 白凤波, 弓箭

《计算机应用》唯一官方网站 2022, 42 (4): 1011-1020. DOI: 10.11772/j.issn.1001-9081.2021071262

摘要（2767）

HTML （222）

PDF （783KB）（1635）

文本情感分析已经逐渐成为自然语言处理（NLP）的重要内容，并在系统推荐、用户情感信息获取，为政府、企业提供舆情参考等领域越来越占据重要地位。通过文献调研的方式，对情感分析领域的方法进行对比和综述。首先，从时间、方法等维度对情感分析的方法进行文献调研；然后，对情感分析的主要方法、应用场景进行归纳总结和对比；最后，在此基础上分析每种方法的优缺点。根据分析结果可以知道，在面对不同的任务场景，主要有三种情感分析的方法：基于情感字典的情感分析法、基于机器学习的情感分析法和基于深度学习的情感分析法，基于多策略混合的方法成为改进的趋势。文献调研表明，文本情感分析的技术方法还有改进的空间，在电子商务、心理治疗、舆情监控方面有较大市场和发展前景。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于卷积神经网络的图像分类算法综述

季长清, 高志勇, 秦静, 汪祖民

《计算机应用》唯一官方网站 2022, 42 (4): 1044-1049. DOI: 10.11772/j.issn.1001-9081.2021071273

摘要（2597）

HTML （228）

PDF （605KB）（1611）

卷积神经网络（CNN）是目前基于深度学习的计算机视觉领域中重要的研究方向之一。它在图像分类和分割、目标检测等的应用中表现出色，其强大的特征学习与特征表达能力越来越受到研究者的推崇。然而，CNN仍存在特征提取不完整、样本训练过拟合等问题。针对这些问题，介绍了CNN的发展、CNN经典的网络模型及其组件，并提供了解决上述问题的方法。通过对CNN模型在图像分类中研究现状的综述，为CNN的进一步发展及研究方向提供了建议。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于改进YOLOv5的安全帽佩戴检测算法

张锦, 屈佩琪, 孙程, 罗蒙

《计算机应用》唯一官方网站 2022, 42 (4): 1292-1300. DOI: 10.11772/j.issn.1001-9081.2021071246

摘要（1266）

HTML （62）

PDF （7633KB）（686）

针对现有安全帽佩戴检测干扰性强、检测精度低等问题，提出一种基于改进YOLOv5的安全帽检测新算法。首先，针对安全帽尺寸不一的问题，使用K-Means++算法重新设计先验框尺寸并将其匹配到相应的特征层；其次，在特征提取网络中引入多光谱通道注意力模块，使网络能够自主学习每个通道的权重，增强特征间的信息传播，从而加强网络对前景和背景的辨别能力；最后，在训练迭代过程中随机输入不同尺寸的图像，以此增强算法的泛化能力。实验结果表明，在自制安全帽佩戴检测数据集上，所提算法的均值平均精度（mAP）达到96.0%，而对佩戴安全帽的工人的平均精度（AP）达到96.7%，对未佩戴安全帽的工人的AP达到95.2%，相较于YOLOv5算法，该算法对佩戴安全帽的平均检测准确率提升了3.4个百分点，满足施工场景下安全帽佩戴检测的准确率要求。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于深度学习的聚类综述

董永峰, 邓亚晗, 董瑶, 王雅琮

《计算机应用》唯一官方网站 2022, 42 (4): 1021-1028. DOI: 10.11772/j.issn.1001-9081.2021071275

摘要（981）

HTML （64）

PDF （623KB）（663）

聚类是一种寻找数据之间内在结构的技术，是许多数据驱动应用领域的一个基本问题，而聚类性能在很大程度上取决于数据表示的质量。近年来，深度学习因其强大的特征提取能力被广泛地应用于聚类任务，以学习更好的特征表示，显著提高了聚类性能。首先，介绍了传统的聚类任务；然后，根据网络结构介绍了基于深度学习的聚类及代表性方法，指出了当前存在的问题，并介绍了基于深度学习的聚类在不同领域的应用；最后，对基于深度学习的聚类发展进行了总结与展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 二进制代码相似性搜索研究进展

夏冰, 庞建民, 周鑫, 单征

《计算机应用》唯一官方网站 2022, 42 (4): 985-998. DOI: 10.11772/j.issn.1001-9081.2021071267

摘要（900）

HTML （114）

PDF （841KB）（1567）

随着物联网和工业互联网的快速发展，网络空间安全的研究日益受到工业界和学术界的重视。由于源代码无法获取，二进制代码相似性搜索成为漏洞挖掘和恶意代码分析的关键核心技术。首先，从二进制代码相似性搜索基本概念出发，给出二进制代码相似性搜索系统框架；然后，围绕相似性技术系统介绍二进制代码语法相似性搜索、语义相似性搜索和语用相似性搜索的发展现状；其次，从二进制哈希、指令序列、图结构、基本块语义、特征学习、调试信息恢复和函数高级语义识别等角度总结比较现有解决方案；最后，展望二进制代码相似性搜索未来发展方向与前景。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 可穿戴脑电图设备关键技术及其应用综述

秦静, 孙法莉, HUI Fang, 汪祖民, 高兵, 季长清

《计算机应用》唯一官方网站 2022, 42 (4): 1029-1035. DOI: 10.11772/j.issn.1001-9081.2021071277

摘要（878）

HTML （41）

PDF （725KB）（671）

可穿戴脑电图（EEG）设备是一种用于日常实时监测的无线EGG系统，因其便携性、实时性、无创性及低成本等优势迅速发展并得到广泛应用。该系统主要由信号采集模块、信号处理模块、微控制模块、通信模块及电源模块等硬件部分以及移动终端模块和云存储模块等软件部分组成。就可穿戴EEG设备关键技术进行论述。首先，阐述了对EGG信号采集模块的改进，另外对可穿戴EEG设备信号预处理模块、信号的降噪、伪影处理及特征提取技术进行比较；然后，对机器学习、深度学习分类算法的优缺点进行分析，并对穿戴式EEG设备的应用领域进行总结；最后，提出可穿戴EEG设备的关键技术未来的发展趋势。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

7. 知识图谱增强的科普文本分类模型

唐望径, 许斌, 仝美涵, 韩美奂, 王黎明, 钟琦

《计算机应用》唯一官方网站 2022, 42 (4): 1072-1078. DOI: 10.11772/j.issn.1001-9081.2021071278

摘要（871）

HTML （50）

PDF （1056KB）（386）

科普文本分类是将科普文章按照科普分类体系进行划分的任务。针对科普文章篇幅超过千字，模型难以聚焦关键信息，造成传统模型分类性能不佳的问题，提出一种结合知识图谱进行两级筛选的科普长文本分类模型，来减少主题无关信息的干扰，提升模型的分类性能。首先，采用四步法构建科普领域的知识图谱；然后，将该知识图谱作为距离监督器，并通过训练句子过滤器来过滤掉无关信息；最后，使用注意力机制对过滤后的句子集做进一步的信息筛选，并实现基于注意力的主题分类模型。在所构建的科普文本分类数据集（PSCD）上的实验结果表明，基于领域知识图谱的知识增强的文本分类算法模型具有更高的F1-Score，相较于TextCNN模型和BERT模型，在F1-Score上分别提升了2.88个百分点和1.88个百分点，验证了知识图谱对于长文本信息筛选的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

8. 基于卷积神经网络的机械故障诊断技术综述

汪祖民, 张志豪, 秦静, 季长清

《计算机应用》唯一官方网站 2022, 42 (4): 1036-1043. DOI: 10.11772/j.issn.1001-9081.2021071266

摘要（794）

HTML （34）

PDF （532KB）（562）

针对传统机械故障诊断方法难以解决人工提取不确定性的问题，提出了大量深度学习的特征提取方法，极大地推动了机械故障诊断的发展。作为深度学习的典型代表，卷积神经网络（CNN）在图像分类、目标检测、图像语义分割等领域都取得了重大的发展，在机械故障诊断领域也有大量文献发表。为了进一步了解利用CNN的方法进行机械故障诊断的问题，首先简单介绍了CNN的相关理论，然后从数据输入类型、迁移学习、预测等方面对CNN在机械故障诊断中的应用进行了归纳总结，最后展望了CNN及其在机械故障诊断应用中的发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

9. 深度强化学习解决动态旅行商问题

陈浩杰, 范江亭, 刘勇

《计算机应用》唯一官方网站 2022, 42 (4): 1194-1200. DOI: 10.11772/j.issn.1001-9081.2021071253

摘要（752）

HTML （23）

PDF （795KB）（472）

针对未设计启发式算法的组合优化问题设计统一的解决方案已成为机器学习领域的一个研究热点，目前成熟的技术主要针对静态的组合优化问题，但是对于加入动态变化的组合优化问题还没有得到充分的解决。为了解决以上问题，提出一个将多头注意力机制与分层强化学习结合来求解动态图上的旅行商问题的轻量级模型Dy4TSP。首先，用以多头注意力机制为基础的预测网络处理来自图卷积神经网络的节点表征向量输入；然后，借助分布式强化学习算法训练来快速地预估图中每个节点被输出作为最优解的可能性，使得模型在不同的可能性中全面探索问题的最优解决方案空间；最后，训练后的模型将实时地生成满足具体目标奖励函数的动作决策序列。该模型在3个组合优问题上进行了评估，实验结果表明，该模型在经典旅行商系列问题中解的质量比开源求解器LKH3高0.15~0.37个单位，明显优于带有边嵌入的图注意网络（EGATE）等最新的算法；并且在其他的动态旅行商问题中可以达到0.1~1.05的最优路径差距，结果也略胜一筹。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

10. 结合BERT和特征投影网络的新闻主题文本分类方法

张海丰, 曾诚, 潘列, 郝儒松, 温超东, 何鹏

《计算机应用》唯一官方网站 2022, 42 (4): 1116-1124. DOI: 10.11772/j.issn.1001-9081.2021071257

摘要（738）

HTML （43）

PDF （1536KB）（371）

针对新闻主题文本用词缺乏规范、语义模糊、特征稀疏等问题，提出了结合BERT和特征投影网络（FPnet）的新闻主题文本分类方法。该方法包含两种实现方式：方式1将新闻主题文本在BERT模型的输出进行多层全连接层特征提取，并将最终提取到的文本特征结合特征投影方法进行提纯，从而强化分类效果；方式2在BERT模型内部的隐藏层中融合特征投影网络进行特征投影，从而通过隐藏层特征投影强化提纯分类特征。在今日头条、搜狐新闻、THUCNews-L、THUCNews-S数据集上进行实验，实验结果表明上述两种方式相较于基线BERT方法在准确率、宏平均F1值上均具有更好的表现，准确率最高分别为86.96%、86.17%、94.40%和93.73%，验证了所提方法的可行性和有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

11. 改进的联邦加权平均算法

罗长银, 王君宇, 陈学斌, 马春地, 张淑芬

《计算机应用》唯一官方网站 2022, 42 (4): 1131-1136. DOI: 10.11772/j.issn.1001-9081.2021071264

摘要（710）

HTML （17）

PDF （468KB）（326）

针对基于层次分析改进的联邦平均算法在计算其数据质量时存在主观因素的影响，提出改进的联邦加权平均算法，从数据质量的角度来处理多源数据。首先，将训练样本划分为预训练样本与预测试样本；然后，使用初始全局模型在预训练数据上的精度作为该数据源的质量权重；最后，将质量权重引入到联邦平均算法中，重新进行全局模型中权重更新。仿真结果表明，在均等分割的数据集与非均等分割的数据集上，改进的联邦加权平均算法训练的模型与传统联邦平均算法训练的模型相比，准确率最高分别提升了1.59%和1.24%；改进的联邦加权平均算法训练的模型与传统整合多方数据再训练的模型相比，虽然准确率略有下降，但数据与模型的安全性有所提升。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

12. 基于改进一维卷积和双向长短期记忆神经网络的故障诊断方法

董永峰, 孙跃华, 高立超, 韩鹏, 季海鹏

《计算机应用》唯一官方网站 2022, 42 (4): 1207-1215. DOI: 10.11772/j.issn.1001-9081.2021071243

摘要（645）

HTML （23）

PDF （2185KB）（432）

针对工业领域中故障诊断数据存在时序性和夹杂强噪声的特点导致的收敛速度慢以及诊断精度低的问题，提出了一种基于改进一维卷积和双向长短期记忆（1DCNN-BiLSTM）神经网络融合的故障诊断方法。该方法包括故障振动信号的预处理、特征的自动提取以及振动信号的分类。首先，采用自适应白噪声的完整经验模态分解（CEEMDAN）技术对原始振动信号进行预处理；其次，构建1DCNN-BiLSTM双通道模型，将处理后信号输入双向长短期记忆（BiLSTM）神经网络模型和一维卷积神经网络（1DCNN）模型两个通道，从而对信号的时序相关性特征、局部空间的非相关性特征和弱周期性规律进行充分提取；然后，针对信号夹杂强噪声的问题，对压缩与激励网络（SENet）模块进行改进并将其作用于两个不同的通道；最后，输入全连接层将双通道提取的特征进行融合并借助Softmax分类器实现对设备故障的精确识别。使用凯斯西储大学轴承数据集进行实验，结果表明改进后的SENet模块同时作用于1DCNN通道和stacked BiLSTM通道，1DCNN-BiLSTM双通道模型在保证快速收敛的情况下有最高诊断精度96.87%，优于传统单通道模型，有效提高了机械设备故障诊断效率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

13. 基于知识图偏好注意力网络的长短期推荐模型及其更新方法

顾军华, 樊帅, 李宁宁, 张素琪

《计算机应用》唯一官方网站 2022, 42 (4): 1079-1086. DOI: 10.11772/j.issn.1001-9081.2021071242

摘要（589）

HTML （27）

PDF （785KB）（198）

目前，知识图谱推荐的研究主要集中在模型建立和训练上。然而在实际应用中，需要使用增量更新方法定期更新模型来适应新用户和老用户偏好的改变。针对大部分该类模型仅利用用户的长期兴趣表示做推荐，而没有考虑用户的短期兴趣且聚合邻域实体得到项目向量表示时聚合方式的可解释性不足，以及更新模型的过程中存在灾难性遗忘的问题，提出基于知识图偏好注意力网络的长短期推荐（KGPATLS）模型及其更新方法。首先，通过KGPATLS模型提出偏好注意力网络的聚合方式以及结合用户长期兴趣和短期兴趣的用户表示方法；然后，为了缓解更新模型存在的灾难性遗忘问题，提出融合预测采样和知识蒸馏的增量更新方法（FPSKD）。将提出的KGPATLS模型和FPSKD方法在MovieLens-1M和Last.FM两个数据集上进行实验。相较于最优基线模型知识图谱卷积网络（KGCN），KGPATLS模型的曲线下面积（AUC）指标在两个数据集上分别有2.2%和1.4%的提升，准确率（Acc）指标分别有2.5%和2.9%的提升。在两个数据集上对比FPSKD与三个基线增量更新方法Fine Tune、Random Sampling、Full Batch，FPSKD在AUC和Acc指标上优于Fine Tune、Random Sampling，在训练时间指标上FPSKD分别降低到Full Batch的大约1/8和1/4。实验结果验证了KGPATLS模型的性能，而FPSKD在保持模型性能的同时可以高效地更新模型。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

14. 基于改进Inception结构的知识图谱嵌入模型

余晓鹏, 何儒汉, 黄晋, 张俊杰, 胡新荣

《计算机应用》唯一官方网站 2022, 42 (4): 1065-1071. DOI: 10.11772/j.issn.1001-9081.2021071265

摘要（571）

HTML （30）

PDF （570KB）（198）

知识图谱嵌入（KGE）将实体和关系映射到低维连续向量空间中，以利用机器学习方法实现关系数据的应用，如知识分析、推理、补全等。以ConvE为代表将卷积神经网络（CNN）应用于知识图谱嵌入中，以捕捉实体和关系的交互信息，但其标准卷积捕捉特征交互信息能力不足，特征表达能力低下。针对特征交互能力不足问题，提出了一种改进的Inception结构，在此基础上构建一个知识图谱嵌入模型InceE。首先，该结构使用混合空洞卷积替代标准卷积，以提高特征交互信息捕捉能力；其次，使用残差网络结构，以减少特征信息丢失。实验使用基准数据集Kinship、FB15k、WN18验证InceE链接预测有效性。在Kinship、FB15k数据集上，相较于ArcE和QuatRE模型，InceE的Hit@1分别提升了1.6和1.5个百分点；在三个数据集上，与ConvE对比，InceE的Hit@1分别提升了6.3、20.8和1.0个百分点。实验结果表明InceE具有更强的特征交互信息捕捉能力。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

15. 支持中文医疗问答的基于注意力机制的栈卷积神经网络模型

滕腾, 潘海为, 张可佳, 牟雪莲, 张锡明, 陈伟鹏

《计算机应用》唯一官方网站 2022, 42 (4): 1125-1130. DOI: 10.11772/j.issn.1001-9081.2021071272

摘要（539）

HTML （57）

PDF （726KB）（278）

当前的中文问答匹配技术大多都需要先进行分词，中文医疗文本的分词问题需要维护医学词典来缓解分词错误对后续任务影响，而维护词典需要大量人力和知识，致使分词问题一直具有极大的挑战性。同时，现有的中文医疗问答匹配方法都是对问题和答案分开建模，并未考虑问题和答案中各自包含的关键词汇间的关联关系。因此，提出了一种基于注意力机制的栈卷积神经网络（Att-StackCNN）模型来解决中文医疗问答匹配问题。首先，使用字嵌入对问题和答案进行编码以得到二者各自的字嵌入矩阵；然后，通过利用问题和答案的字嵌入矩阵构造注意力矩阵来得到二者各自的特征注意力映射矩阵；接着，利用栈卷积神经网络（Stack-CNN）模型同时对上述矩阵进行卷积操作，从而得到问题和答案各自的语义表示；最后，进行相似度计算，并利用相似度计算最大边际损失以更新网络参数。所提模型在cMedQA数据集上的Top-1正确率比Stack-CNN模型高接近1个百分点，比Multi-CNNs模型高接近0.5个百分点。实验结果表明，Att-StackCNN模型可以提升中文医疗问答匹配效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

16. 基于改进卷积神经网络与支持向量机结合的面部表情识别算法

乔桂芳, 侯守明, 刘彦彦

《计算机应用》唯一官方网站 2022, 42 (4): 1253-1259. DOI: 10.11772/j.issn.1001-9081.2021071270

摘要（538）

HTML （29）

PDF （1504KB）（258）

针对当前卷积神经网络（CNN）利用端层特征进行面部表情识别存在模型结构繁琐、训练参数过多、识别不够理想的问题，提出一种基于改进CNN与支持向量机（SVM）相结合的优化算法。首先，利用连续卷积的思想设计网络模型，以获取更多非线性激活；然后，采用自适应全局平均池化（GAP）层取代传统CNN中的全连接层，以减少网络参数量；最后，用SVM分类器代替传统Softmax函数实现表情识别，以提高模型泛化能力。实验结果表明，所提算法在Fer2013和CK+数据集上分别取得了73.4%和98.06%的识别准确率，与传统LeNet-5算法相比，在Fer2013数据集上提升了2.2个百分点，且该网络模型结构简单、参数量较少，具有良好的鲁棒性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

17. 基于联邦增量学习的工业物联网数据共享方法

刘晶, 董志红, 张喆语, 孙志刚, 季海鹏

《计算机应用》唯一官方网站 2022, 42 (4): 1235-1243. DOI: 10.11772/j.issn.1001-9081.2021071182

摘要（530）

HTML （21）

PDF （763KB）（445）

针对工业物联网（IIOT）新增数据量大、工厂子端数据量不均衡的问题，提出了一种基于联邦增量学习的IIOT数据共享方法（FIL-IIOT）。首先，将行业联合模型下发到工厂子端作为本地初始模型；然后，提出联邦优选子端算法来动态调整参与子集；最后，通过联邦增量学习算法计算出工厂子端的增量加权，从而使新增状态数据与原行业联合模型快速融合。实验结果表明，在美国凯斯西储大学（CWRU）轴承故障数据集上，所提FIL-IIOT使轴承故障诊断精度达到93.15%，比联邦均值（FedAvg）算法和无增量公式的FIL-IIOT（FIL-IIOT-NI）方法分别提高了6.18个百分点和2.59个百分点，满足了基于工业增量数据的行业联合模型持续优化的需求。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

18. 基于麻雀搜索算法和改进粒子群优化算法的网络入侵检测算法

高兵, 郑雅, 秦静, 邹启杰, 汪祖民

《计算机应用》唯一官方网站 2022, 42 (4): 1201-1206. DOI: 10.11772/j.issn.1001-9081.2021071276

摘要（516）

HTML （35）

PDF （616KB）（213）

针对网络入侵检测模型自适应能力不足的问题，将麻雀搜索算法（SSA）中的大范围快速搜索能力引入到粒子群优化（PSO）算法，提出基于麻雀搜索算法的改进粒子群优化（SSAPSO）算法。该算法通过对轻量级梯度提升机（LightGBM）算法中难以整定的参数进行寻优，使PSO算法在保证寻优精度的同时快速收敛，并得到最优的网络入侵检测模型。仿真实验结果表明，在4种基准函数上，SSAPSO比基本PSO算法收敛速度更快；在KDDCUP99数据集上，SSAPSO优化LightGBM后得到的SSAPSO-LightGBM算法比分类特征和梯度提升（CatBoost）算法的准确率、召回率、精确率和F1指数分别提升了15.12%、3.25%、21.26%和12.25%；SSAPSO-LightGBM算法在上述数据集中正常流量（Normal）、未授权远程访问（R2L）攻击、未授权本地访问（U2R）攻击、监听（PROBE）攻击的检测准确率比LightGBM算法分别提升了0.61%、3.14%、4.24%、1.04%和5.03%。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

19. 基于动态加权函数的集成分类算法

王乐, 韩萌, 李小娟, 张妮, 程浩东

《计算机应用》唯一官方网站 2022, 42 (4): 1137-1147. DOI: 10.11772/j.issn.1001-9081.2021071259

摘要（506）

HTML （12）

PDF （838KB）（108）

针对数据流集成分类如何使分类器适应不断变化的数据流，调整基分类器的权重选择合适的分类器集合的问题，提出了一种基于动态加权函数的集成分类算法。首先，提出了一种加权函数调节基分类器的权重，使用不断更新的数据块训练分类器；然后，使用一个新的权重函数对候选分类器进行一个合理的选择；最后，在基分类器中应用决策树的增量性质，实现对数据流的分类。通过大量实验发现，基于动态加权函数的集成分类算法的性能不受块的大小影响，与AUE2算法相比，叶子数平均减少了681.3、节点数平均减少了1 192.8，树的深度平均减少了4.42，同时相对地提高了准确率，降低了消耗时间。实验结果表明该算法在对数据流进行分类时不但可以保证准确率还可以节省大量的内存空间和时间。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

20. 基于自注意力机制时频谱同源特征融合的鸟鸣声分类

刘志华, 陈文洁, 陈爱斌

《计算机应用》唯一官方网站 2022, 42 (4): 1260-1268. DOI: 10.11772/j.issn.1001-9081.2021071258

摘要（492）

HTML （11）

PDF （1376KB）（190）

目前深度学习模型大都难以应对复杂背景噪声下的鸟鸣声分类问题。考虑到鸟鸣声具有时域连续性、频域高低性特点，提出了一种利用同源谱图特征进行融合的模型用于复杂背景噪声下的鸟鸣声分类。首先，使用卷积神经网络（CNN）提取鸟鸣声梅尔时频谱特征；然后，使用特定的卷积以及下采样操作，将同一梅尔时频谱特征的时域和频域维度分别压缩至1，得到仅包含鸟鸣声高低特性的频域特征以及连续特性的时域特征。基于上述提取频域以及时域特征的操作，在时域和频域维度上同时对梅尔时频谱特征进行提取，得到具有连续性以及高低特性的时频域特征。然后，将自注意力机制分别用于得到的时域、频域、时频域特征以加强其各自拥有的特性。最后，将这三类同源谱图特征决策融合后的结果用于鸟鸣声分类。所提模型用于Xeno-canto网站的8种鸟类音频分类，并在分类对比实验中取得了平均精确率（MAP）为0.939的较好结果。实验结果表明该模型能应对复杂背景噪声下的鸟鸣声分类效果较差的问题。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

21. 结合广义自回归预训练语言模型与循环卷积神经网络的文本情感分析方法

潘列, 曾诚, 张海丰, 温超东, 郝儒松, 何鹏

《计算机应用》唯一官方网站 2022, 42 (4): 1108-1115. DOI: 10.11772/j.issn.1001-9081.2021071180

摘要（489）

HTML （15）

PDF （728KB）（265）

传统的机器学习方法在对网络评论文本进行情感极性分类时，未能充分挖掘语义信息和关联信息，而已有的深度学习方法虽能提取语义信息和上下文信息，但该过程往往是单向的，在获取评论文本的深层语义信息过程中存在不足。针对以上问题，提出了一种结合广义自回归预训练语言模型（XLNet）与循环卷积神经网络（RCNN）的文本情感分析方法。首先，利用XLNet对文本进行特征表示，并通过引入片段级递归机制和相对位置信息编码，充分利用了评论文本的语境信息，从而有效提升了文本特征的表达能力；然后，利用RCNN对文本特征进行双向训练，并在更深层次上提取文本的上下文语义信息，从而提升了在情感分析任务中的综合性能。所提方法分别在三个公开数据集weibo-100k、waimai-10k和ChnSentiCorp上进行了实验，准确率分别达到了96.4%、91.8%和92.9%。实验结果证明了所提方法在情感分析任务中的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

22. 基于局部冗余混合编码的故障快速恢复方法

刘靖宇, 牛秋霞, 李萧言, 史巧硕, 武优西

《计算机应用》唯一官方网站 2022, 42 (4): 1244-1252. DOI: 10.11772/j.issn.1001-9081.2021111917

摘要（462）

HTML （7）

PDF （926KB）（68）

最大距离可分（MDS）码中校验块均为全局校验块，重构链长度随着存储系统规模扩大而增长，重构性能逐渐降低。针对上述问题提出一种新型的非最大距离可分（Non-MDS）码：局部冗余混合编码Code-LM（s，c）。首先，为缩小重构链长度，任意条带单元组内只有局部校验块，分别为组内水平校验块和水平对角校验块，并设计了局部冗余混合编码的校验布局；然后，根据不同校验块的生成规则，设计了失效数据块的4种重构方式，不同失效块的重构链具有公共块；最后，根据两个故障磁盘所在条带单元组距离不同，将双盘故障分为3种情况，并设计了对应的重构算法。理论分析和实验结果表明，存储规模相同时，与RDP相比，Code-LM（s，c）的单盘重构时间和双盘重构时间可减少84%和77%；与V²-Code相比，Code-LM（s，c）的单盘重构时间和双盘重构时间可减少67%和73%。因此局部冗余混合编码可支持故障磁盘快速恢复，提高存储系统可靠性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

23. 基于场景变化的传输控制协议拥塞控制切换方案

赖涵光, 李清, 江勇

《计算机应用》唯一官方网站 2022, 42 (4): 1225-1234. DOI: 10.11772/j.issn.1001-9081.2021050722

摘要（461）

HTML （11）

PDF （1097KB）（245）

针对轻量级基于学习的拥塞控制算法在某些场景下性能表现会出现断崖式下滑的问题，提出了一种基于场景变化的传输控制协议拥塞控制切换方案。首先，该方案模拟实时的网络环境；然后，根据实时的环境参数来识别场景；最后，将当前的拥塞控制算法切换至该场景下相对最优的轻量级基于学习的拥塞控制算法。实验结果表明，所提方案相较于原来使用单个拥塞控制算法的方案，例如测量瓶颈链路带宽和时延的拥塞控制（BBR）方案、面向性能的拥塞控制（PCC）方案等，可以使不同场景下的网络性能得到显著提升，总吞吐量增幅达到5%以上，总时延降幅达到10%以上。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

24. 融合多时间尺度和特征加强的知识图谱推荐模型

张素琪, 王鑫鑫, 佘世耀, 顾军华

《计算机应用》唯一官方网站 2022, 42 (4): 1093-1098. DOI: 10.11772/j.issn.1001-9081.2021071241

摘要（456）

HTML （16）

PDF （582KB）（274）

针对现有的知识图谱推荐模型没有考虑到用户的周期特征以及待推荐项目会对用户近期兴趣产生影响的问题，提出一种融合多时间尺度和特征加强的知识图谱推荐模型（MTFE）。首先，采用长短期记忆（LSTM）网络在不同时间尺度上挖掘用户的周期特征并融入到用户表示中；然后，通过注意力机制挖掘待推荐项目中与用户近期特征相关性较强的特征，将其加强后融入项目表示中；最后，通过评分函数计算用户对待推荐项目的评分。在真实数据集Last.FM、MovieLens-1M和MovieLens-20M上把所提模型和个性化实体推荐（PER）、协同知识嵌入（CKE）、LibFM、RippleNet、知识图卷积网络（KGCN）、协同知识感知注意网络（CKAN）等知识图谱推荐模型进行对比。实验结果表明，在三个数据集上MTFE相较于表现最优的对比模型的F1性能分别提升了0.78、1.63和1.92个百分点，AUC指标在三个数据集上分别提升了3.94、2.73和1.15个百分点。可见，所提模型相较于对比图谱推荐模型有更好的推荐效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

25. 基于无采样协作知识图网络的推荐系统

蒋雯静, 熊熙, 李中志, 李斌勇

《计算机应用》唯一官方网站 2022, 42 (4): 1057-1064. DOI: 10.11772/j.issn.1001-9081.2021071255

摘要（449）

HTML （25）

PDF （679KB）（236）

知识图谱（KG）可以通过高效组织海量数据实现信息的有效抽取，因而基于知识图谱的推荐方法得到了广泛的研究和应用。针对图神经网络在知识图谱建模中的采样误差问题，提出了一种无采样协作知识图网络（NCKN）的方法。首先，设计了无采样知识传播模块，通过在单个卷积层使用不同大小的线性聚合器来捕捉深层次的信息，实现高效的无采样预计算；然后，为了区分邻居节点贡献度，在传播过程中引入注意力机制；最后，协作传播模块将知识嵌入同用户交互中的协作信号相结合，以更好地描述用户偏好。基于三个真实数据集，评估了NCKN在CTR预测和Top-k预测中的性能。实验结果表明，与主流算法RippleNet、知识图卷积神经网络（KGCN）相比，NCKN在CTR预测中的准确率平均分别提升了2.71%、4.60%；Top-k预测中，NCKN的准确率平均分别提升了5.26%、3.91%。所提方法不仅解决了图神经网络在知识图谱建模中的采样误差问题，且提升了推荐模型的准确率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

26. 无线供能移动边缘计算系统的安全卸载优化

曾续玲, 李陶深, 巩健, 杜利俊

《计算机应用》唯一官方网站 2022, 42 (4): 1216-1224. DOI: 10.11772/j.issn.1001-9081.2021071254

摘要（440）

HTML （7）

PDF （827KB）（90）

针对能量受限的多用户移动边缘计算（MEC）系统存在恶意窃听节点的问题，提出一种联合无线能量传输（WPT）和MEC的安全部分计算卸载方案。该方法以系统接入点（AP）能耗最小化为优化目标，在计算延迟、安全卸载和能量捕获约束条件下，联合优化AP能量传输协方差矩阵、本地CPU频率、用户卸载比特数、用户卸载时间分配以及用户传输功率。针对AP能耗最小化问题为非凸问题，首先采用凸差分算法（DCA）将原始非凸问题转换为凸问题，然后采用拉格朗日对偶法以半封闭形式获得问题最优解。当计算任务数为5×10⁵比特时，与本地计算和安全全部计算卸载方法相比，安全部分卸载方案的能量消耗分别降低了61.3%和84.4%；当窃听节点距离超过25 m时，安全部分卸载方案所消耗的能量远小于本地计算和安全全部计算卸载。仿真实验结果表明，在保证物理层安全卸载的情况下，所提方案能够有效降低AP能耗、提高系统性能增益。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

27. 融合协同过滤信息的知识图注意力网络

顾军华, 王锐, 李宁宁, 张素琪

《计算机应用》唯一官方网站 2022, 42 (4): 1087-1092. DOI: 10.11772/j.issn.1001-9081.2021071269

摘要（434）

HTML （14）

PDF （558KB）（199）

知识图谱（KG）能够缓解协同过滤算法存在的数据稀疏和冷启动问题，在推荐领域被广泛地研究和应用。现有的很多基于KG的推荐模型混淆了用户物品二部图中的协同过滤信息和KG中实体间的关联信息，导致学习到的用户向量和物品向量无法准确表达其特征，甚至引入与用户、物品无关的信息从而干扰推荐。针对上述问题提出一种融合协同信息的知识图注意力网络（KGANCF）。首先，为了避免KG实体信息的干扰，网络的协同过滤层从用户物品二部图中挖掘出用户和物品的协同过滤信息；然后，在知识图注意力嵌入层中应用图注意力机制，从KG中继续提取与用户和物品密切相关的属性信息；最后，在预测层将用户物品的协同过滤信息和KG中的属性信息融合，得到用户和物品最终向量表示，进而预测用户对物品的评分。在MovieLens-20M和Last.FM数据集上进行了实验，与协同知识感知注意力网络（CKAN）相比，KGANCF在MovieLens-20M数据集上的F1分数提升了1.1个百分点，曲线下面积（AUC）提升了0.6个百分点；而在KG相对稀疏的Last.FM数据集上，模型的F1分数提升了3.3个百分点，AUC提升了8.5个百分点。实验结果表明，KGANCF能够有效提高推荐结果的准确度，在KG稀疏的数据集上显著优于协同知识嵌入（CKE）、知识图谱卷积网络（KGCN）、知识图注意网络（KGAT）和CKAN模型。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

28. 融合实体描述信息和邻居节点特征的知识表示学习方法

焦守龙, 段友祥, 孙歧峰, 庄子浩, 孙琛皓

《计算机应用》唯一官方网站 2022, 42 (4): 1050-1056. DOI: 10.11772/j.issn.1001-9081.2021071227

摘要（434）

HTML （23）

PDF （671KB）（195）

知识图谱表示学习旨在将实体和关系映射到一个低维稠密的向量空间中。现有的大多数相关模型更注重于学习三元组的结构特征，忽略了三元组内的实体关系的语义信息特征和三元组外的实体描述信息特征，因此知识表达能力较差。针对以上问题，提出了一种融合多源信息的知识表示学习模型BAGAT。首先，结合知识图谱特征来构造三元组实体目标节点和邻居节点，并使用图注意力网络（GAT）聚合三元组结构的语义信息表示；然后，使用BERT词向量模型对实体描述信息进行嵌入表示；最后，将两种表示方法映射到同一个向量空间中进行联合知识表示学习。实验结果表明，BAGAT性能较其他模型有较大提升，在公共数据集FB15K-237链接预测任务的Hits@1与Hits@10指标上，与翻译模型TransE相比分别提升了25.9个百分点和22.0个百分点，与图神经网络模型KBGAT相比分别提升了1.8个百分点和3.5个百分点。可见，融合实体描述信息和三元组结构语义信息的多源信息表示方法可以获得更强的表示学习能力。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

29. 基于情感词典和堆叠残差的双向长短期记忆网络的情感分析

罗浩然, 杨青

《计算机应用》唯一官方网站 2022, 42 (4): 1099-1107. DOI: 10.11772/j.issn.1001-9081.2021071179

摘要（430）

HTML （27）

PDF （887KB）（445）

情感分析作为自然语言处理（NLP）的细分研究方向经历了使用情感词典、机器学习和深度学习分析的发展过程。针对使用一般化的深度学习模型作为文本分类器对于特定领域的网络评论类型的文本的分析的精准度较低，训练时发生过拟合现象以及情感词典覆盖率低、编纂工作量大的问题，提出了基于情感词典和堆叠残差的双向长短期记忆（Bi-LSTM）网络的情感分析模型。首先，借助情感词典中情感词的设计覆盖“教育机器人”研究领域内的专业词汇，从而弥补Bi-LSTM模型在分析此类文本时精准度的不足；然后，使用Bi-LSTM和SnowNLP来降低情感词典的编纂体量。长短期记忆（LSTM）网络的“记忆门”“遗忘门”结构可以在保证充分考虑评论文本中的前后词语的关联性的同时，适时选择遗忘一些已分析词语，从而避免反向传播时的梯度爆炸问题。而在将堆叠残差的Bi-LSTM引入后，不仅使得模型的层数加深至8层，而且还使残差网络避免了叠加LSTM时会导致的“退化”问题；最后，通过适当设置和调整两部分的得分权重，并将总分使用Sigmoid激活函数标准化到［0，1］的区间上，按照［0，0.5］，（0.5，1］的区间划分分别表示负面和正面情绪，完成情感分类。实验结果表明，在“教育机器人”评论数据集中，所提模型对于情感分类准确率相较于标准的LSTM模型提升了约4.5个百分点，相较于BERT提升了约2.0个百分点。综上，所提模型将基于情感词典和深度学习模型的情感分类方法一般化；而通过修改情感词典中的情感词汇并适当调整深度学习模型的结构和层数，所提模型可以应用于电子商务平台中各类商品的购物评价的精确情感分析，从而帮助企业洞悉消费者的购物心理和市场需求，同时也可以为消费者提供商品质量的一种参考标准。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

30. 基于正负效用划分的高效用模式挖掘方法综述

张妮, 韩萌, 王乐, 李小娟, 程浩东

《计算机应用》唯一官方网站 2022, 42 (4): 999-1010. DOI: 10.11772/j.issn.1001-9081.2021071268

摘要（430）

HTML （39）

PDF （1254KB）（382）

高效用模式挖掘（HUPM）是新兴的数据科学研究内容之一，通过考虑事务数据库中项的单位利润和数量，以提取出更有用的信息。传统的HUPM方法假定所有项的效用值均为正，但是在实际应用中，某些数据项的效用值可能为负（如商品因产生亏损而导致利润值为负），含负项的模式挖掘与仅含正项的模式挖掘同样重要。首先，阐述了HUPM的相关概念，并分别给出相应正负效用的实例；然后，以正与负角度划分了HUPM方法，其中带有正效用的模式挖掘方法进一步以动态与静态的数据库新颖角度划分，带有负效用的模式挖掘方法中包括了基于先验、基于树、基于效用列表和基于数组等关键技术，并从不同方面对这些方法进行了讨论和总结；最后，给出了现有HUPM方法的不足和下一步研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

虚拟专题文章