人工智能

Select

1. 面向区块链的在线联邦增量学习算法

罗长银, 陈学斌, 马春地, 王君宇

计算机应用 2021, 41 (2): 363-371. DOI: 10.11772/j.issn.1001-9081.2020050609

摘要（851）

PDF （2197KB）（1119）

针对传统数据处理技术存在模型过时、泛化能力减弱以及并未考虑多源数据安全性的问题，提出一种面向区块链的在线联邦增量学习算法。该算法将集成学习与增量学习应用到联邦学习的框架下，使用stacking集成算法来整合多方本地模型，且将模型训练阶段的模型参数上传至区块链并快速同步，使得在建立的全局模型准确率仅下降1%的情况下，模型在训练阶段与存储阶段的安全性均得到了提升，降低了数据存储与模型参数传输的成本，同时也降低了因模型梯度更新造成数据泄漏的风险。实验结果表明，在公开的数据集上进行训练，各时间段内模型的准确度均在91.5%以上，且方差均低于10 ^-5；与传统整合数据训练模型相比，该模型在准确率上略有下降，但能够在保证模型准确率的同时提高数据与模型的安全性。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于离子运动-人工蜂群算法的移动机器人路径规划

魏博, 杨茸, 舒思豪, 万勇, 苗建国

计算机应用 2021, 41 (2): 379-383. DOI: 10.11772/j.issn.1001-9081.2020060794

摘要（585）

PDF （950KB）（846）

针对移动机器人在仓储环境下的路径规划问题，提出了一种基于离子运动的人工蜂群（IM-ABC）算法用于路径规划。该方法为提高传统的人工蜂群（ABC）算法在路径规划中的收敛速度和搜索能力，采用一种模拟离子运动规律来更新蜂群的策略。首先，在算法前期利用离子运动算法中的阴阳离子交叉搜索来更新引领蜂和跟随蜂，从而引导种群进化方向，极大提高种群开发能力；其次，在算法后期为了避免前期过早收敛导致局部最优，引领蜂采用随机搜索，跟随蜂则利用反向轮盘赌来选择蜜源，以扩大种群多样性；最后，在全局更新机制中提出自适应性花香浓度以改善抽样方式，进而得到改进后的IM-ABC算法。标准测试函数测试与仿真实验结果表明，IM-ABC算法不仅能快速收敛，且和传统ABC算法相比迭代次数减少了58.3%，寻优性能提升了12.6%，表现出较高的规划效率。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于图文融合的情感分析研究综述

孟祥瑞, 杨文忠, 王婷

《计算机应用》唯一官方网站 2021, 41 (2): 307-317. DOI: 10.11772/j.issn.1001-9081.2020060923

摘要（959）

PDF （1277KB）（1853）

随着信息化技术的不断提升，各类社交平台上带有倾向性的图文数据量快速增长，图文融合的情感分析受到广泛关注，单一的情感分析方法不再能够满足多模态数据的需求。针对图文情感特征提取与融合的技术难题，首先，列举了目前应用较广的图文情感分析数据集，介绍了文本特征和图片特征的提取方式；然后，重点研究了当前图文特征融合方式，简述了在图文情感分析过程中存在的问题；最后，针对未来情感分析的研究方向进行了总结与展望。为深入了解图文融合技术，采用文献调研方法对图文情感分析的研究进行综述，有助于比较不同融合方法之间的区别，发现更具价值的研究方案。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于多图神经网络的会话感知推荐模型

南宁, 杨程屹, 武志昊

计算机应用 2021, 41 (2): 330-336. DOI: 10.11772/j.issn.1001-9081.2020060805

摘要（694）

PDF （1052KB）（637）

针对基于会话的推荐算法主要依赖目标会话中的信息，而未充分利用其他会话中的协同信息的问题，提出了一种基于多图神经网络的会话感知推荐（MGSP）模型。首先，根据目标会话与训练集中的所有会话构建物品转移图（ITG）和协同关联图（CRG），并基于这两张图应用图神经网络（GNN）来汇聚节点的信息，得到两类的节点表示；然后，经过双层注意力模块对两类节点表示建模，获取会话级别的表示；最后，使用注意力机制进行信息融合，得到最终的会话表示，并预测下一个交互物品。分别在电商和民航两个场景下进行了对比实验，实验结果表明，相较最优的基准模型，MGSP模型在电商数据集各项指标上的提高超过1个百分点，在民航数据集各项指标上的提高约为3个百分点，验证了MGSP模型的有效性。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于可微神经计算机和贝叶斯网络的知识推理方法

孙建强, 许少华

计算机应用 2021, 41 (2): 337-342. DOI: 10.11772/j.issn.1001-9081.2020060843

摘要（429）

PDF （1252KB）（527）

针对人工神经网络（ANN）对面向知识图谱（KG）的知识推理的记忆能力有限以及KG无法处理不确定知识的问题，提出一种可微神经计算机（DNC）和贝叶斯网络（BN）相结合的推理方法DNC-BN。首先，将长短时记忆（LSTM）网络作为控制器，在每个时刻对输入向量和从记忆体获取的读向量进行处理，得到网络输出向量和交互向量；其次，通过读写头实现控制器与记忆体的交互，使用读取权重计算数据的加权平均以得到读向量，并用写入权重结合擦除向量及写入向量进行写操作，对存储矩阵进行修改；最后，基于概率推理机制，使用BN对数据节点之间存在的推理关系进行判断，对KG进行补全。在数据集WN18RR上的推理中，DNC-BN的Mean Rank为2 615，Hits@10为0.528；在数据集FB15k-237上的推理中，DNC-BN的Mean Rank为202，Hits@10为0.519。实验结果表明，DNC-BN方法对面向KG的知识推理具有良好的应用效果。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于贝叶斯估计与区域划分遍历的四轴飞行器避障路径规划算法

王家亮, 李树华, 张海涛

计算机应用 2021, 41 (2): 384-389. DOI: 10.11772/j.issn.1001-9081.2020060962

摘要（463）

PDF （1767KB）（862）

为了提高利用图像处理技术进行四轴飞行器避障的实时性，提出一种基于贝叶斯估计与区域划分遍历的避障路径规划算法。首先，通过贝叶斯估计来对四轴飞行器采集到的视频图像进行预处理；其次，对采集到的图像进行障碍物概率分析以获取视频图像中的关键帧，最大限度地提高四轴飞行器的实时性；最后，对选取的图像帧进行背景差分实现障碍物识别，并通过实现基于区域划分的像素点遍历算法提高障碍物识别的准确性。实验结果表明，在保证障碍物识别性能的前提下，所提算法使四轴飞行器进行避障时的实时性有所提升，且四轴飞行器的理想轨迹与实际飞行轨迹的最大距离为25.6 cm，最小距离为0.2 cm。可见所提出的避障路径规划算法为四轴飞行器利用摄像头采集的视频图像进行避障提供了一种高效的解决方案。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于改进遗传算法的无人机路径规划

黄书召, 田军委, 乔路, 王沁, 苏宇

计算机应用 2021, 41 (2): 390-397. DOI: 10.11772/j.issn.1001-9081.2020060797

摘要（1147）

PDF （1487KB）（1528）

针对传统遗传算法收敛速度慢、容易陷入局部最优、规划路径不够平滑、代价高等问题，提出了一种基于改进遗传算法的无人机（UAV）路径规划方法，该算法对遗传算法的选择算子、交叉算子和变异算子进行改进，从而规划出平滑、可飞的路径。首先，建立适合UAV田间信息获取的环境模型，并考虑UAV的目标函数与约束条件以建立适合本场景的更为复杂、精确的数学模型；然后，提出了混合无重串选择算子、非对称映射交叉算子和启发式多次变异算子，寻找最优路径以及扩大种群搜索范围；最后，采用三次B样条曲线对规划出的路径进行平滑，得到平滑的飞行路径，并且减少了算法的计算时间。实验结果表明，与传统遗传算法相比，所提算法的代价值降低了68%，收敛迭代次数减少了67%；相较蚁群优化（ACO）算法，其代价值降低了55%，收敛迭代次数减少了58%。通过大量对比实验得出，当交叉率的值为（1/染色体长度）时，算法的收敛效果最好。在不同环境下进行算法性能测试，结果表明所提算法具有很好的环境适应性，适合于复杂环境下的路径规划。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于双域自注意力机制的行人属性识别

吴锐, 刘宇, 冯凯

计算机应用 2021, 41 (2): 372-378. DOI: 10.11772/j.issn.1001-9081.2020060850

摘要（508）

PDF （1165KB）（866）

针对行人属性识别任务中不同属性对特征粒度和特征依赖性的需求不同的问题，提出了一种基于由空间自注意力机制和通道自注意力机制组成的双域自注意力机制的行人属性识别模型。首先，使用ResNet50作为骨干网络，提取出具有一定语义信息的特征；然后将得到的特征分别输入到双分支网络中，提取具有空间依赖性与语义相关性的自注意力特征以及整体性信息的全局特征；最后，融合双分支的特征，并利用批归一化（BN）和加权损失的策略降低行人属性样本不平衡的影响。在两个行人属性数据集PETA和RAP上的实验结果表明，所提出的模型比基准模型的平均准确率指标分别提高了3.91个百分点和4.05个百分点，在已提出的行人属性识别模型中具有较强的竞争力。基于双域自注意力机制的行人属性识别方法可在监控场景下对行人进行结构化描述，提高行人分析和检索等任务的准确度和效率。

参考文献 | 相关文章 | 多维度评价

Select

9. 基于注意力与图卷积网络的关系抽取模型

王晓霞, 钱雪忠, 宋威

计算机应用 2021, 41 (2): 350-356. DOI: 10.11772/j.issn.1001-9081.2020081310

摘要（529）

PDF （995KB）（1831）

针对关系抽取任务中句子依存树的信息利用率低和特征提取效果不佳的问题，提出了一种基于注意力引导的门控感知图卷积网络（Att-Gate-GCN）模型。首先，利用一种基于注意力机制的软剪枝策略，通过注意力机制为依存树中的边分配权重，以挖掘依存树中的有效信息，同时过滤无用信息；其次，构建一种门控感知图卷积网络（GCN）结构，通过门控机制增加特征感知能力，以获取更鲁棒的关系特征，同时结合依存树中的局部与非局部依赖特征，进一步抽取关键信息；最后，将关键信息输入分类器得到关系类别标签。实验结果表明，相较于原始的图卷积网络关系抽取模型，所提模型在SemEval2010-Task8数据集和KBP37数据集上F1值分别有2.2个百分点和3.8个百分点的提升，能够更充分地利用有效信息，提升了模型的关系抽取能力。

参考文献 | 相关文章 | 多维度评价

Select

10. 融合语法规则的双通道中文情感模型分析

邱宁佳, 王晓霞, 王鹏, 王艳春

计算机应用 2021, 41 (2): 318-323. DOI: 10.11772/j.issn.1001-9081.2020050723

摘要（543）

PDF （1093KB）（1232）

针对使用中文文本进行情感分析时，忽略语法规会降低分类准确率的问题，提出一种融合语法规则的双通道中文情感分类模型CB_Rule。首先设计语法规则提取出情感倾向更加明确的信息，再利用卷积神经网络（CNN）的局部感知特点提取出语义特征；然后考虑到规则处理时可能忽略上下文的问题，使用双向长短时记忆（Bi-LSTM）网络提取包含上下文信息的全局特征，并对局部特征进行融合补充，从而完善CNN模型的情感特征倾向信息；最后将完善后的特征输入到分类器中进行情感倾向判定，完成中文情感模型的构建。在中文电商评论文本数据集上将所提模型与融合语法规则的Bi-LSTM中文情感分类方法R-Bi-LSTM以及融合句法规则和CNN的旅游评论情感分析模型SCNN进行对比，实验结果表明，所提模型在准确率上分别提高了3.7个百分点和0.6个百分点，说明CB_Rule模型具有很好的分类效果。

参考文献 | 相关文章 | 多维度评价

Select

11. 基于句法依存分析的图网络生物医学命名实体识别

许力, 李建华

计算机应用 2021, 41 (2): 357-362. DOI: 10.11772/j.issn.1001-9081.2020050738

摘要（542）

PDF （845KB）（1088）

现有的生物医学命名实体识别方法没有利用语料中的句法信息，准确率不高。针对这一问题，提出基于句法依存分析的图网络生物医学命名实体识别模型。首先利用卷积神经网络（CNN）生成字符向量并将其与词向量拼接，然后将其送入双向长短期记忆（BiLSTM）网络进行训练；其次以句子为单位对语料进行句法依存分析，并构建邻接矩阵；最后将BiLSTM的输出和通过句法依存分析构建的邻接矩阵送入图卷积网络（GCN）进行训练，并引入图注意力机制优化邻接节点的特征权重得到模型输出。所提模型在JNLPBA和NCBI-disease数据集上的F1值分别达到了76.91%和87.80%，相比基准模型分别提升了2.62和1.66个百分点。实验结果证明，提出的方法能有效提升模型在生物医学命名实体识别任务上的表现。

参考文献 | 相关文章 | 多维度评价

Select

12. 融合用户历史行为与社交关系的个性化社交事件推荐方法

孙鹤立, 徐统, 何亮, 贾晓琳

计算机应用 2021, 41 (2): 324-329. DOI: 10.11772/j.issn.1001-9081.2020050666

摘要（481）

PDF （919KB）（798）

为了提升基于事件的社交网络（EBSN）中社交事件的推荐效果，提出了融合用户历史行为和社交关系的个性化社交事件推荐方法。首先采用深度学习技术从用户的历史行为以及用户之间的潜在社交关系两个方面建立用户模型；然后在对用户偏好建模时，引入用户偏好的负向量表示，并使用注意力权重层根据不同的候选推荐事件为用户历史行为中不同的事件和用户社交关系中不同的好友分配不同的权重，同时考虑了事件以及群组的多种特征；最后在真实数据集上进行了大量实验。实验结果表明，该个性化社交事件推荐方法在命中率（HR）、归一化折损累计增益（NDCG）、平均倒数排名（MRR）评价指标上优于对比的深度用户社交事件推荐（DUMER）模型和融合注意力机制的深度兴趣网络（DIN）模型。

参考文献 | 相关文章 | 多维度评价

Select

13. 基于边缘关注模型的语义分割方法

佘玉龙, 张晓龙, 程若勤, 邓春华

计算机应用 2021, 41 (2): 343-349. DOI: 10.11772/j.issn.1001-9081.2020050725

摘要（617）

PDF （1372KB）（757）

肝脏是人体代谢功能的主要器官，目前机器学习在肝脏影像语义分割研究中的难点有：1）肝脏中间部位有下腔静脉、软组织和血管，甚至有坏死或肝裂等情况；2）肝脏与一些邻近器官之间的边界模糊，难以分辨。针对这些问题，提出了边缘关注模型（EAM）及边缘关注网络（EANet）。该网络采用了Encoder-Decoder（编码-解码）的模型框架：在编码器中运用了在ImageNet上预训练好的残差网络ResNet34和EAM，由此来充分获取肝脏边缘的细节特征信息；在解码器中则运用了反卷积操作和EAM对有效信息进行特征提取，进而得到肝脏影像的语义分割图。最后，对分割后噪声较大的图片实施了平滑处理。在三个数据集上与AHCNet进行对比，结果显示：在3Dircadb数据集上，EANet的体积重叠误差（VOE）和相对体积差异（RVD）分别降低了1.95个百分点和0.11个百分点，且DICE精度提高了1.58个百分点；在Sliver07数据集上，EANet的VOE、最大表面距离（MSD）和均方差对称表面距离（RMSD）分别降低了大约1个百分点、3.3 mm和0.2 mm；在某医院临床MRI肝脏影像数据集上，EANet的VOE和RVD分别降低了0.88个百分点和0.31个百分点，且DICE精度提高了1.48个百分点。实验结果表明，所提出的EANet具有较好的肝脏图像分割效果。

参考文献 | 相关文章 | 多维度评价

Select

14. 基于粗糙集理论的不完备数据分析方法的混合信息系统填补算法

彭莉, 张海清, 李代伟, 唐聃, 于曦, 何磊

计算机应用 2021, 41 (3): 677-685. DOI: 10.11772/j.issn.1001-9081.2020060894

摘要（550）

PDF （1135KB）（742）

为了提高基于粗糙集理论的不完备数据分析方法（ROUSTIDA）在实际应用中对包含离散型（如整型、字符串型、枚举型）、连续型（如浮点数表达）、缺失型属性的混合信息系统（HIS）数据的填补能力，提出了一种基于粗糙集理论的混合信息系统缺失值填补方法（RSHISMIA）。首先，根据决策属性等价类划分思想并按照决策属性对混合信息系统HIS进行划分，解决了填补后可能出现的决策规则冲突问题；其次，定义混合距离矩阵来合理量化对象间的相似性，从而筛选出具有填补能力的样本并克服ROUSTIDA无法处理连续性属性的缺点；然后，结合近邻思想解决了ROUSTIDA在无差别对象属性值发生冲突情况下无法对相同属性缺失数据进行填补的问题。最后，使用10个UCI标准数据集进行实验，将所提出的方法与ROUSTIDA、K近邻填补（KNNI）算法、随机森林填补（RFI）算法和矩阵分解（MF）等几种经典算法进行了比较。实验结果表明，与ROUSTIDA相比，所提方法在查全率上平均高出81%，在查准率上提升了5%~53%，且其归一化均方根误差（NRMSE）最多减小了0.12。此外，所提方法的分类准确率与ROUSTIDA相比平均提升了7%，且优于KNNI、RFI及MF等填补算法。

参考文献 | 相关文章 | 多维度评价

Select

15. 基于优势演员-评论家算法的强化自动摘要模型

杜嘻嘻, 程华, 房一泉

计算机应用 2021, 41 (3): 699-705. DOI: 10.11772/j.issn.1001-9081.2020060837

摘要（500）

PDF （975KB）（941）

针对长文本自动摘要任务中抽取式模型摘要较为冗余，而生成式摘要模型时常有关键信息丢失、摘要不准确和生成内容重复等问题，提出一种面向长文本的基于优势演员-评论家算法的强化自动摘要模型（A2C-RLAS）。首先，用基于卷积神经网络（CNN）和循环神经网络（RNN）的混合神经网络的抽取器（extractor）来提取原文关键句；然后，用基于拷贝机制和注意力机制的重写器（rewriter）来精炼关键句；最后，使用强化学习的优势演员-评论家（A2C）算法训练整个网络，把重写摘要和参考摘要的语义相似性（BERTScore值）作为奖励（reward）来指导抽取过程，从而提高抽取器提取句子的质量。在CNN/Daily Mail数据集上的实验结果表明，与基于强化学习的抽取式摘要（Refresh）模型、基于循环神经网络的抽取式摘要序列模型（SummaRuNNer）和分布语义奖励（DSR）模型等模型相比，A2C-RLAS的最终摘要内容更加准确、语言更加流畅，冗余的内容有效减少，且A2C-RLAS的ROUGE和BERTScore指标均有提升。相较于Refresh模型和SummaRuNNer模型，A2C-RLAS模型的ROUGE-L值分别提高了6.3%和10.2%；相较于DSR模型，A2C-RLAS模型的F1值提高了30.5%。

参考文献 | 相关文章 | 多维度评价

Select

16. 基于高斯差分特征网络的显著目标检测

后云龙, 朱磊, 陈琴, 吕燧栋

计算机应用 2021, 41 (3): 706-713. DOI: 10.11772/j.issn.1001-9081.2020060957

摘要（502）

PDF （1463KB）（929）

中心-邻域对比度理论作为具有生理学依据的一种线索，在传统显著性检测模型中获得了广泛应用，然而该理论却很少显式地应用在基于深度卷积神经网络（CNN）的模型中。为了将经典的中心-邻域对比度理论引入深度卷积网络中，提出了一种基于高斯差分（DoG）特征网络的显著目标检测模型。首先通过在多个尺度的深度特征上构造高斯差分金字塔（DGP）结构以感知图像中显著目标的局部突出特性，进而用所得到的差分特征对语义信息丰富的深度特征进行加权选择，最终实现对显著目标的准确提取。进一步地，在提出的网络设计中采用标准的一维卷积来实现高斯平滑过程，从而在降低计算复杂度的同时实现了网络端到端的训练。通过把所提模型与六种显著目标检测算法在四个公用数据集上的实验结果进行对比，可知所提模型取得的结果在平均绝对误差（MAE）和最大F度量值的定量评价中均取得了最优表现，尤其是在DUTS-TE数据集上所提模型取得的结果的最大F度量值和平均绝对误差分别达到了0.885和0.039。实验结果表明，所提模型在复杂自然场景中对于显著目标具有良好的检测性能。

参考文献 | 相关文章 | 多维度评价

Select

17. 基于低秩行为信息和多尺度卷积神经网络的人体行为识别方法

蒋丽, 黄仕建, 严文娟

计算机应用 2021, 41 (3): 721-726. DOI: 10.11772/j.issn.1001-9081.2020060958

摘要（464）

PDF （1376KB）（998）

针对人体行为识别中传统行为信息获取方法需要繁琐步骤和各类假设的问题，结合卷积神经网络（CNN）在图像视频处理中的优越性能，提出了一种基于低秩行为信息（LAI）和多尺度卷积神经网络（MCNN）的人体行为识别方法。首先，对行为视频进行分段，并分别对每个视频段进行低秩学习以提取到相应的LAI，然后在时间轴上对这些LAI进行连接以获取整个视频的LAI，进而有效捕获视频中的行为信息，避免了繁琐的提取步骤和各类假设。其次，针对LAI的特点，设计了MCNN模型。该模型通过多尺度卷积核获取不同感受野下的LAI行为特征，并合理设计各卷积层、池化层及全连接层来进一步提炼特征并最终输出行为类别。将所提出的方法在KTH和HMDB51两个基准数据库上进行性能验证，同时设计和进行了三组对比实验。实验结果表明，所提方法在两个数据库上分别取得了97.33%和72.05%的识别率，与双重变换（TFT）方法和深时间嵌入网络（DTEN）方法相比，识别率分别至少提高了0.67和1.15个百分点。所提方法能进一步促进行为识别技术在安防、人机交互等领域的广泛应用。

参考文献 | 相关文章 | 多维度评价

Select

18. 基于面部特征图对称的人脸正面化生成对抗网络算法

李虹霞, 秦品乐, 闫寒梅, 曾建潮, 鲍骞月, 柴锐

计算机应用 2021, 41 (3): 714-720. DOI: 10.11772/j.issn.1001-9081.2020060779

摘要（745）

PDF （1432KB）（832）

目前人脸正面化研究主要解决人脸偏转问题，而对监控视频等现实场景中同时受偏转和俯仰变化影响的侧脸的正面化生成关注较少，针对这个问题和多角度侧脸生成的正面人脸图存在身份信息保留不全的问题，提出了一种基于特征图对称模块和眼周特征保留损失的生成对抗网络（GAN）。首先，根据人脸对称性先验，提出特征图对称模块，先使用人脸关键点检测器检测出侧脸鼻尖点位置，再将编码器提取到的特征图依照鼻尖位置进行镜像对称，从而在特征层面上缓解面部信息缺失的问题。其次，借鉴眼周识别思想，在现有的生成图身份保留方法中加入了眼周特征保留损失以训练生成器生成逼真的且保留身份信息的人脸正面图像。实验结果表明，所提算法得到的生成图面部细节保留较好，且在CAS-PEAL-R1数据集的所有俯角下人脸的平均Rank-1识别率为99.03%，可见该算法能够有效解决多角度侧脸的正面化问题。

参考文献 | 相关文章 | 多维度评价

Select

19. 连续手语识别中的文本纠正和补全方法

龙广玉, 陈益强, 邢云冰

计算机应用 2021, 41 (3): 694-698. DOI: 10.11772/j.issn.1001-9081.2020060798

摘要（522）

PDF （877KB）（1204）

针对基于视频的连续手语识别的文本结果存在语义模糊、语序混乱的问题，提出一种两步法将连续手语识别结果的手语文本转化为通顺、可懂的汉语文本。第一步，基于自然手语规则以及 N元语言模型（ N-gram）对连续手语识别的结果进行文本调序；第二步，利用汉语通用量词数据集训练双向长短期记忆（Bi-LSTM）网络模型，以解决手语语法无量词的问题，从而提升语句通顺度。使用绝对准确率和最长正确子序列占比作为文本调序的评价指标，实验结果显示，所提方法的文本调序结果绝对准确率为77.06%，最长正确子序列占比为86.55%，量词补全准确率为97.23%。所提的方法能够有效提升连续手语识别的文本结果的通畅度和可懂度，已成功应用于基于视频的连续手语识别，提升了听障人和健听人的无障碍交流体验。

参考文献 | 相关文章 | 多维度评价

Select

20. 基于ZYNQ平台的YOLOv3压缩和加速

郭文旭, 苏远歧, 刘跃虎

计算机应用 2021, 41 (3): 669-676. DOI: 10.11772/j.issn.1001-9081.2020060994

摘要（1113）

PDF （1391KB）（1770）

高精度物体检测网络急剧增加的参数和计算量使得它们很难在车辆和无人机等端侧设备上直接部署使用。针对这一问题，从网络压缩和计算加速两方面入手，提出了一种面向残差网络的新型压缩方案来实现YOLOv3的压缩，并通过ZYNQ平台对这一压缩后的网络进行加速。首先，提出了包括网络裁剪和网络量化两方面的网络压缩算法。网络裁剪方面，给出了针对残差结构的裁剪策略来将网络剪枝分为通道剪枝和残差链剪枝两个粒度，解决了通道剪枝无法应对残差连接的局限性，进一步降低了模型的参数量；网络量化方面，实现了一种基于相对熵的模拟量化方法，以通道为单位对参数进行量化，在线统计模型的参数分布与参数量化造成的信息损失，从而辅助选择最优量化策略来减少量化过程的精度损失。然后，在ZYNQ平台上设计并改进了8比特的卷积加速模块，从而优化了片上缓存结构并结合Winograd算法实现了压缩后YOLOv3的加速。实验结果表明，所提压缩算法较YOLOv3 tiny能够进一步降低模型尺寸，但检测精度提升了7个百分点；同时ZYNQ平台上的硬件加速方法获得了比其他平台更高的能耗比，从而推进了YOLOv3以及其他残差网络在ZYNQ端侧的实际部署。

参考文献 | 相关文章 | 多维度评价

Select

21. 结合改进密度峰值聚类和共享子空间的协同训练算法

吕佳, 鲜焱

计算机应用 2021, 41 (3): 686-693. DOI: 10.11772/j.issn.1001-9081.2020071095

摘要（413）

PDF （2185KB）（470）

针对协同训练算法在迭代过程中加入的无标记样本的有用信息不足和多分类器对样本标记不一致导致的分类错误累积问题，提出结合改进密度峰值聚类和共享子空间的协同训练算法。该算法先采取属性集合互补的方式得到两个基分类器，然后基于虹吸平衡法则进行改进密度峰值聚类，并从簇中心出发来推进式选择相互邻近度高的无标记样本交由两个基分类器进行分类，最后利用多视图非负矩阵分解算法得到的共享子空间来确定标记不一致样本的最终类别。该算法利用改进密度峰值聚类和相互邻近度选择出更具空间结构代表性的无标记样本，并采用共享子空间来修订标记不一致的样本，解决了因样本误分类造成的分类精度低的问题。在9个UCI数据集上的多组对比实验证明了该算法的有效性，实验结果表明所提算法相较于对比算法在7个数据集上取得最高的分类正确率，在另2个数据集取得次高的分类正确率。

参考文献 | 相关文章 | 多维度评价

Select

22. 基于距离加权重叠度估计与椭圆拟合优化的精确目标跟踪算法

王宁, 宋慧慧, 张开华

计算机应用 2021, 41 (4): 1100-1105. DOI: 10.11772/j.issn.1001-9081.2020060869

摘要（461）

PDF （2560KB）（439）

为解决判别式相关滤波（DCF）跟踪算法在跟踪目标旋转或非刚性形变时的模型漂移、尺度粗糙、跟踪失败问题，提出一种基于距离加权重叠度估计与椭圆拟合优化的精确目标跟踪算法（DWOP-EFO）。首先，同时采用矩形框之间的重叠度和中心距离作为动态锚框质量评价的依据，能够缩小预测结果与目标区域之间的空间距离，缓解模型漂移问题；其次，为了进一步提高跟踪精度，采用轻量化的目标分割网络将目标从背景中分割出来，再利用椭圆拟合算法对分割轮廓进行优化并输出稳定的旋转矩形框，实现对目标尺度的精确估计；最后，通过尺度置信度优化策略对置信度高的尺度结果实现门控输出。所提算法能缓解模型漂移问题，同时有利于增强跟踪器的鲁棒性和提升跟踪精度。在两个最为流行的评测数据集VOT2018和OTB100上进行了实验，结果表明：在VOT2018数据集上，所提算法的期望平均重叠率（EAO）指标比基于重叠度最大化准确跟踪算法（ATOM）提高2.2个百分点，相较于基于可学习的判别模型跟踪器（DiMP）提高1.9个百分点；同时，所提算法在OTB100评测数据集上的成功率指标比ATOM高出1.3个百分点，特别是在非刚性形变属性上效果显著。所提算法在评测数据集上的平均运行速率均超过25 frame/s实现了实时跟踪。

参考文献 | 相关文章 | 多维度评价

Select

23. 自由文本电子病历信息抽取综述

崔博文, 金涛, 王建民

计算机应用 2021, 41 (4): 1055-1063. DOI: 10.11772/j.issn.1001-9081.2020060796

摘要（827）

PDF （1090KB）（1427）

电子病历信息抽取技术能够从自由文本电子病历中获取到有用的关键信息，从而为医院的信息管理和后续的信息分析处理工作提供帮助。简要介绍了现阶段自由文本电子病历信息抽取的主要流程，分析了近十几年来关于自由文本电子病历中命名实体、实体修饰与实体间关系三类关键信息的单独抽取以及联合抽取方法的研究成果，对这些成果所采用的主要方法、使用的数据集、最终的实验效果等进行了对比总结。除此之外，还对最新的几种流行方法的特点以及优缺点进行了分析，对目前电子病历信息抽取领域常用数据集进行了总结，分析了目前国内相关领域的现状和发展趋势。

参考文献 | 相关文章 | 多维度评价

Select

24. 基于自编码器的多视图属性网络表示学习模型

樊玮, 王慧敏, 邢艳

计算机应用 2021, 41 (4): 1064-1070. DOI: 10.11772/j.issn.1001-9081.2020061006

摘要（450）

PDF （1029KB）（606）

现有的大多数网络表示学习方法很难兼顾网络中丰富的结构信息和属性信息，导致其后续任务，如分类、聚类等的效果不佳。针对此问题，提出一种基于自编码器的多视图属性网络表示学习模型（AE-MVANR）。首先，将网络的拓扑结构信息转化为拓扑结构视图（TSV），通过计算节点间相同属性共现频率来构造属性结构视图（ASV）；然后，在两个视图上分别利用随机游走算法得到若干节点序列；最后，经过自编码器训练得到的序列，从而得到融合了结构信息和属性信息的节点表示向量。在几个真实数据集上进行了分类、聚类任务的大量实验，结果表明，所提AE-MVANR优于常用的仅基于网络结构的和同时基于网络结构信息及节点属性信息的网络表示学习方法，具体来说该模型的分类准确率最高提升43.75%，而其聚类结果的标准化互信息（NMI）和轮廓系数（Silhouette Coefficient）指标最高增幅分别为137.95%和1 314.63%，戴维森堡丁指数（DBI）最大降幅达45.99%。

参考文献 | 相关文章 | 多维度评价

Select

25. 基于自适应邻域的鲁棒多视图聚类算法

李杏峰, 黄玉清, 任珍文, 李毅红

计算机应用 2021, 41 (4): 1093-1099. DOI: 10.11772/j.issn.1001-9081.2020060828

摘要（498）

PDF （1021KB）（1074）

针对现存的基于自适应邻域的多视图聚类算法没有考虑噪声和共识图信息损失的问题，提出一种基于自适应邻域的鲁棒多视图聚类（RMVGC）算法。首先，为了避免噪声和异常值对数据的影响，通过鲁棒主成分分析模型（RPCA）从原始数据中学习多个干净的低秩数据；其次，用自适应邻域学习直接融合多个干净的低秩数据来得到一个干净的共识关系图，从而减少图融合过程中的信息丢失。实验结果表明，所提RMVGC算法的标准化互信息（NMI）在MRSCV1、BBCSport、COIL20、ORL和UCI digits数据集上比目前流行的多视图聚类算法分别提升了5.2、1.36、27.2、4.66和5.85个百分点。同时，该算法保持了数据局部结构，增强了对原始数据的鲁棒性，提高了关系图质量，在多视图数据集上具有较好的聚类性能。

参考文献 | 相关文章 | 多维度评价

Select

26. 案例推理分类器的权重分配及案例库维护方法

严爱军, 魏志远

计算机应用 2021, 41 (4): 1071-1077. DOI: 10.11772/j.issn.1001-9081.2020071016

摘要（397）

PDF （871KB）（888）

由于特征权重分配以及案例库维护对案例推理（CBR）分类器的性能有重要影响，提出了用蚁狮（ALO）算法来分配权重且用高斯混合模型的期望最大化算法（GMMEM）进行案例库维护的案例推理算法模型——AGECBR（Ant Lion and Expectation Maximization of Gaussian Mixture Model Case-Based Reasoning）。首先采用蚁狮算法对特征权重进行分配，在这个过程中将案例推理分类准确率作为蚁狮算法对特征权重进行迭代寻优的适应度函数，以此实现特征权重的优化分配；然后，使用高斯混合模型的期望最大化算法对案例库中的各案例进行聚类分析，并删除其中的噪声案例和冗余案例，从而实现案例库的维护。在UCI标准数据集上进行了实验，所提模型AGECBR比反向传播（BP）、 k-近邻（kNN）等分类算法平均分类准确率提升了3.83~5.44个百分点。实验结果表明，AGECBR能够使案例推理分类准确率得到有效改进。

参考文献 | 相关文章 | 多维度评价

Select

27. 基于注意力机制的主题扩展情感对话生成

杨丰瑞, 霍娜, 张许红, 韦巍

计算机应用 2021, 41 (4): 1078-1083. DOI: 10.11772/j.issn.1001-9081.2020071063

摘要（713）

PDF （937KB）（1166）

越来越多的研究开始聚焦于情感对话生成，然而现有的研究往往只关注情感因素，却忽视了对话中主题的相关性和多样性以及与主题密切相关的情感倾向，这可能导致生成响应的质量下降。因此提出一种融合主题信息和情感因素的主题扩展情感对话生成模型。该模型首先将对话上下文进行全局编码，引入主题模型以获得全局主题词，并使用外部情感词典获得全局情感词；其次在融合模块里利用语义相似度扩展主题词，并利用依存句法分析提取与主题相关的情感词；最后将上下文、主题词和情感词输入到一个基于注意力机制的解码器中，促使解码器生成主题相关的情感响应。实验结果表明，该模型能生成内容丰富且情感相关的回答。相较于主题增强情感对话生成模型（TE-ECG），所提出的模型在unigram多样性（distinct-1）和bigram多样性（distinct-2）上平均提高了16.3%和15.4%；相较于基于注意力机制的序列到序列模型（Seq2SeqA），所提出的模型在unigram多样性（distinct-1）和bigram多样性（distinct-2）上平均提高了26.7%和28.7%。

参考文献 | 相关文章 | 多维度评价

Select

28. 基于差别矩阵的区间值决策系统 β分布约简

李磊涛, 张楠, 童向荣, 岳晓冬

计算机应用 2021, 41 (4): 1084-1092. DOI: 10.11772/j.issn.1001-9081.2020040563

摘要（416）

PDF （935KB）（419）

当前区间类型数据的规模越来越大，若采用传统的属性约简方法进行处理，就需要对数据进行预处理，而这会损失原始信息。针对上述问题，提出了区间值决策系统 β分布的约简算法。首先，给出区间值决策系统 β分布的概念和约简目标，并证明了提出的相关定理；然后，对于该约简目标构建了 β分布约简的差别矩阵和差别函数，提出了区间值决策系统 β分布约简算法；最后，使用14组UCI数据集进行实验验证。在数据集Statlog上，当相似度阈值为0.6，对象数目为100、200、400、600、846时， β分布约简算法的平均约简长度为1.6、2.2、1.4、2.4、2.6，基于差别矩阵的分布约简算法（DRADM）的平均约简长度为2.0、3.0、3.0、4.0、4.0，基于差别矩阵的最大分布约简算法（MDRADM）的平均约简长度为2.0、3.0、3.0、4.0、3.0。实验结果验证了所提 β分布约简算法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

29. 基于注意力自身线性融合的弱监督细粒度图像分类算法

陆鑫伟, 余鹏飞, 李海燕, 李红松, 丁文谦

计算机应用 2021, 41 (5): 1319-1325. DOI: 10.11772/j.issn.1001-9081.2020071105

摘要（477）

PDF （1945KB）（1261）

随着人工智能的飞速发展，计算机视觉领域对图像的分类任务不仅仅限于识别出物体的大类，更需要对同一类别的图像进行更加细致的子类划分。为了有效区分出类间的微小差异以及减少背景因素的干扰，提出了一种基于AABP的细粒度分类算法。首先，通过Inception V3预训练模型提取全局图像特征，并利用深度可分离卷积在特征映射上预测出局部注意力区域；然后，应用弱监督数据增强网络（WS-DAN）的算法将增强后的图像反馈回网络中，以此加强网络的泛化能力，防止过拟合；最后，将进一步提取的注意力特征区域在AABP网络中进行线性融合，以提升分类的精度。实验结果表明，该算法在数据集CUB-200-2011上达到88.51%的准确率、97.65%的top5准确率，在Stanford Cars数据集上到89.77%的准确率、99.27%的top5准确率，在FGVC-Aircraft数据集上到93.5%的准确率、97.96%的top5准确率。

参考文献 | 相关文章 | 多维度评价

Select

30. 基于注意力机制的特征融合-双向门控循环单元多模态情感分析

赖雪梅, 唐宏, 陈虹羽, 李珊珊

计算机应用 2021, 41 (5): 1268-1274. DOI: 10.11772/j.issn.1001-9081.2020071092

摘要（1192）

PDF （960KB）（1880）

针对视频多模态情感分析中，未考虑跨模态的交互作用以及各模态贡献程度对最后情感分类结果的影响的问题，提出一种基于注意力机制的特征融合-双向门控循环单元多模态情感分析模型（AMF-BiGRU）。首先，利用双向门控循环单元（BiGRU）来考虑各模态中话语间的相互依赖关系，并得到各模态的内部信息；其次，通过跨模态注意力交互网络层将模态内部信息与模态之间的交互作用相结合；然后，引入注意力机制来确定各模态的注意力权重，并将各模态特征进行有效融合；最后，通过全连接层和softmax层获取情感分类结果。在公开的CMU-MOSI和CMU-MOSEI数据集上进行实验。实验结果表明，与传统的多模态情感分析方法（如多注意力循环网络（MARN））相比，AMF-BiGRU模型在CMU-MOSI数据集上的准确率和F1值分别提升了6.01%和6.52%，在CMU-MOSEI数据集上的准确率和F1值分别提升了2.72%和2.30%。可见，AMF-BiGRU模型能够有效提高多模态的情感分类性能。

参考文献 | 相关文章 | 多维度评价

虚拟专题文章