《计算机应用》唯一官方网站

孟祥瑞, 杨文忠, 王婷

2021, 41(2): 307-317. DOI: 10.11772/j.issn.1001-9081.2020060923

摘要 ( )

PDF (1277KB) ( )

参考文献 | 相关文章 | 计量指标

随着信息化技术的不断提升，各类社交平台上带有倾向性的图文数据量快速增长，图文融合的情感分析受到广泛关注，单一的情感分析方法不再能够满足多模态数据的需求。针对图文情感特征提取与融合的技术难题，首先，列举了目前应用较广的图文情感分析数据集，介绍了文本特征和图片特征的提取方式；然后，重点研究了当前图文特征融合方式，简述了在图文情感分析过程中存在的问题；最后，针对未来情感分析的研究方向进行了总结与展望。为深入了解图文融合技术，采用文献调研方法对图文情感分析的研究进行综述，有助于比较不同融合方法之间的区别，发现更具价值的研究方案。

融合语法规则的双通道中文情感模型分析

邱宁佳, 王晓霞, 王鹏, 王艳春

2021, 41(2): 318-323. DOI: 10.11772/j.issn.1001-9081.2020050723

摘要 ( )

PDF (1093KB) ( )

参考文献 | 相关文章 | 计量指标

针对使用中文文本进行情感分析时，忽略语法规会降低分类准确率的问题，提出一种融合语法规则的双通道中文情感分类模型CB_Rule。首先设计语法规则提取出情感倾向更加明确的信息，再利用卷积神经网络（CNN）的局部感知特点提取出语义特征；然后考虑到规则处理时可能忽略上下文的问题，使用双向长短时记忆（Bi-LSTM）网络提取包含上下文信息的全局特征，并对局部特征进行融合补充，从而完善CNN模型的情感特征倾向信息；最后将完善后的特征输入到分类器中进行情感倾向判定，完成中文情感模型的构建。在中文电商评论文本数据集上将所提模型与融合语法规则的Bi-LSTM中文情感分类方法R-Bi-LSTM以及融合句法规则和CNN的旅游评论情感分析模型SCNN进行对比，实验结果表明，所提模型在准确率上分别提高了3.7个百分点和0.6个百分点，说明CB_Rule模型具有很好的分类效果。

融合用户历史行为与社交关系的个性化社交事件推荐方法

孙鹤立, 徐统, 何亮, 贾晓琳

2021, 41(2): 324-329. DOI: 10.11772/j.issn.1001-9081.2020050666

摘要 ( )

PDF (919KB) ( )

参考文献 | 相关文章 | 计量指标

为了提升基于事件的社交网络（EBSN）中社交事件的推荐效果，提出了融合用户历史行为和社交关系的个性化社交事件推荐方法。首先采用深度学习技术从用户的历史行为以及用户之间的潜在社交关系两个方面建立用户模型；然后在对用户偏好建模时，引入用户偏好的负向量表示，并使用注意力权重层根据不同的候选推荐事件为用户历史行为中不同的事件和用户社交关系中不同的好友分配不同的权重，同时考虑了事件以及群组的多种特征；最后在真实数据集上进行了大量实验。实验结果表明，该个性化社交事件推荐方法在命中率（HR）、归一化折损累计增益（NDCG）、平均倒数排名（MRR）评价指标上优于对比的深度用户社交事件推荐（DUMER）模型和融合注意力机制的深度兴趣网络（DIN）模型。

基于多图神经网络的会话感知推荐模型

南宁, 杨程屹, 武志昊

2021, 41(2): 330-336. DOI: 10.11772/j.issn.1001-9081.2020060805

摘要 ( )

PDF (1052KB) ( )

参考文献 | 相关文章 | 计量指标

针对基于会话的推荐算法主要依赖目标会话中的信息，而未充分利用其他会话中的协同信息的问题，提出了一种基于多图神经网络的会话感知推荐（MGSP）模型。首先，根据目标会话与训练集中的所有会话构建物品转移图（ITG）和协同关联图（CRG），并基于这两张图应用图神经网络（GNN）来汇聚节点的信息，得到两类的节点表示；然后，经过双层注意力模块对两类节点表示建模，获取会话级别的表示；最后，使用注意力机制进行信息融合，得到最终的会话表示，并预测下一个交互物品。分别在电商和民航两个场景下进行了对比实验，实验结果表明，相较最优的基准模型，MGSP模型在电商数据集各项指标上的提高超过1个百分点，在民航数据集各项指标上的提高约为3个百分点，验证了MGSP模型的有效性。

基于可微神经计算机和贝叶斯网络的知识推理方法

孙建强, 许少华

2021, 41(2): 337-342. DOI: 10.11772/j.issn.1001-9081.2020060843

摘要 ( )

PDF (1252KB) ( )

参考文献 | 相关文章 | 计量指标

针对人工神经网络（ANN）对面向知识图谱（KG）的知识推理的记忆能力有限以及KG无法处理不确定知识的问题，提出一种可微神经计算机（DNC）和贝叶斯网络（BN）相结合的推理方法DNC-BN。首先，将长短时记忆（LSTM）网络作为控制器，在每个时刻对输入向量和从记忆体获取的读向量进行处理，得到网络输出向量和交互向量；其次，通过读写头实现控制器与记忆体的交互，使用读取权重计算数据的加权平均以得到读向量，并用写入权重结合擦除向量及写入向量进行写操作，对存储矩阵进行修改；最后，基于概率推理机制，使用BN对数据节点之间存在的推理关系进行判断，对KG进行补全。在数据集WN18RR上的推理中，DNC-BN的Mean Rank为2 615，Hits@10为0.528；在数据集FB15k-237上的推理中，DNC-BN的Mean Rank为202，Hits@10为0.519。实验结果表明，DNC-BN方法对面向KG的知识推理具有良好的应用效果。

基于边缘关注模型的语义分割方法

佘玉龙, 张晓龙, 程若勤, 邓春华

2021, 41(2): 343-349. DOI: 10.11772/j.issn.1001-9081.2020050725

摘要 ( )

PDF (1372KB) ( )

参考文献 | 相关文章 | 计量指标

肝脏是人体代谢功能的主要器官，目前机器学习在肝脏影像语义分割研究中的难点有：1）肝脏中间部位有下腔静脉、软组织和血管，甚至有坏死或肝裂等情况；2）肝脏与一些邻近器官之间的边界模糊，难以分辨。针对这些问题，提出了边缘关注模型（EAM）及边缘关注网络（EANet）。该网络采用了Encoder-Decoder（编码-解码）的模型框架：在编码器中运用了在ImageNet上预训练好的残差网络ResNet34和EAM，由此来充分获取肝脏边缘的细节特征信息；在解码器中则运用了反卷积操作和EAM对有效信息进行特征提取，进而得到肝脏影像的语义分割图。最后，对分割后噪声较大的图片实施了平滑处理。在三个数据集上与AHCNet进行对比，结果显示：在3Dircadb数据集上，EANet的体积重叠误差（VOE）和相对体积差异（RVD）分别降低了1.95个百分点和0.11个百分点，且DICE精度提高了1.58个百分点；在Sliver07数据集上，EANet的VOE、最大表面距离（MSD）和均方差对称表面距离（RMSD）分别降低了大约1个百分点、3.3 mm和0.2 mm；在某医院临床MRI肝脏影像数据集上，EANet的VOE和RVD分别降低了0.88个百分点和0.31个百分点，且DICE精度提高了1.48个百分点。实验结果表明，所提出的EANet具有较好的肝脏图像分割效果。

基于注意力与图卷积网络的关系抽取模型

王晓霞, 钱雪忠, 宋威

2021, 41(2): 350-356. DOI: 10.11772/j.issn.1001-9081.2020081310

摘要 ( )

PDF (995KB) ( )

参考文献 | 相关文章 | 计量指标

针对关系抽取任务中句子依存树的信息利用率低和特征提取效果不佳的问题，提出了一种基于注意力引导的门控感知图卷积网络（Att-Gate-GCN）模型。首先，利用一种基于注意力机制的软剪枝策略，通过注意力机制为依存树中的边分配权重，以挖掘依存树中的有效信息，同时过滤无用信息；其次，构建一种门控感知图卷积网络（GCN）结构，通过门控机制增加特征感知能力，以获取更鲁棒的关系特征，同时结合依存树中的局部与非局部依赖特征，进一步抽取关键信息；最后，将关键信息输入分类器得到关系类别标签。实验结果表明，相较于原始的图卷积网络关系抽取模型，所提模型在SemEval2010-Task8数据集和KBP37数据集上F1值分别有2.2个百分点和3.8个百分点的提升，能够更充分地利用有效信息，提升了模型的关系抽取能力。

基于句法依存分析的图网络生物医学命名实体识别

许力, 李建华

2021, 41(2): 357-362. DOI: 10.11772/j.issn.1001-9081.2020050738

摘要 ( )

PDF (845KB) ( )

参考文献 | 相关文章 | 计量指标

现有的生物医学命名实体识别方法没有利用语料中的句法信息，准确率不高。针对这一问题，提出基于句法依存分析的图网络生物医学命名实体识别模型。首先利用卷积神经网络（CNN）生成字符向量并将其与词向量拼接，然后将其送入双向长短期记忆（BiLSTM）网络进行训练；其次以句子为单位对语料进行句法依存分析，并构建邻接矩阵；最后将BiLSTM的输出和通过句法依存分析构建的邻接矩阵送入图卷积网络（GCN）进行训练，并引入图注意力机制优化邻接节点的特征权重得到模型输出。所提模型在JNLPBA和NCBI-disease数据集上的F1值分别达到了76.91%和87.80%，相比基准模型分别提升了2.62和1.66个百分点。实验结果证明，提出的方法能有效提升模型在生物医学命名实体识别任务上的表现。

面向区块链的在线联邦增量学习算法

罗长银, 陈学斌, 马春地, 王君宇

2021, 41(2): 363-371. DOI: 10.11772/j.issn.1001-9081.2020050609

摘要 ( )

PDF (2197KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统数据处理技术存在模型过时、泛化能力减弱以及并未考虑多源数据安全性的问题，提出一种面向区块链的在线联邦增量学习算法。该算法将集成学习与增量学习应用到联邦学习的框架下，使用stacking集成算法来整合多方本地模型，且将模型训练阶段的模型参数上传至区块链并快速同步，使得在建立的全局模型准确率仅下降1%的情况下，模型在训练阶段与存储阶段的安全性均得到了提升，降低了数据存储与模型参数传输的成本，同时也降低了因模型梯度更新造成数据泄漏的风险。实验结果表明，在公开的数据集上进行训练，各时间段内模型的准确度均在91.5%以上，且方差均低于10^-5；与传统整合数据训练模型相比，该模型在准确率上略有下降，但能够在保证模型准确率的同时提高数据与模型的安全性。

基于双域自注意力机制的行人属性识别

吴锐, 刘宇, 冯凯

2021, 41(2): 372-378. DOI: 10.11772/j.issn.1001-9081.2020060850

摘要 ( )

PDF (1165KB) ( )

参考文献 | 相关文章 | 计量指标

针对行人属性识别任务中不同属性对特征粒度和特征依赖性的需求不同的问题，提出了一种基于由空间自注意力机制和通道自注意力机制组成的双域自注意力机制的行人属性识别模型。首先，使用ResNet50作为骨干网络，提取出具有一定语义信息的特征；然后将得到的特征分别输入到双分支网络中，提取具有空间依赖性与语义相关性的自注意力特征以及整体性信息的全局特征；最后，融合双分支的特征，并利用批归一化（BN）和加权损失的策略降低行人属性样本不平衡的影响。在两个行人属性数据集PETA和RAP上的实验结果表明，所提出的模型比基准模型的平均准确率指标分别提高了3.91个百分点和4.05个百分点，在已提出的行人属性识别模型中具有较强的竞争力。基于双域自注意力机制的行人属性识别方法可在监控场景下对行人进行结构化描述，提高行人分析和检索等任务的准确度和效率。

基于离子运动-人工蜂群算法的移动机器人路径规划

魏博, 杨茸, 舒思豪, 万勇, 苗建国

2021, 41(2): 379-383. DOI: 10.11772/j.issn.1001-9081.2020060794

摘要 ( )

PDF (950KB) ( )

参考文献 | 相关文章 | 计量指标

针对移动机器人在仓储环境下的路径规划问题，提出了一种基于离子运动的人工蜂群（IM-ABC）算法用于路径规划。该方法为提高传统的人工蜂群（ABC）算法在路径规划中的收敛速度和搜索能力，采用一种模拟离子运动规律来更新蜂群的策略。首先，在算法前期利用离子运动算法中的阴阳离子交叉搜索来更新引领蜂和跟随蜂，从而引导种群进化方向，极大提高种群开发能力；其次，在算法后期为了避免前期过早收敛导致局部最优，引领蜂采用随机搜索，跟随蜂则利用反向轮盘赌来选择蜜源，以扩大种群多样性；最后，在全局更新机制中提出自适应性花香浓度以改善抽样方式，进而得到改进后的IM-ABC算法。标准测试函数测试与仿真实验结果表明，IM-ABC算法不仅能快速收敛，且和传统ABC算法相比迭代次数减少了58.3%，寻优性能提升了12.6%，表现出较高的规划效率。

基于贝叶斯估计与区域划分遍历的四轴飞行器避障路径规划算法

王家亮, 李树华, 张海涛

2021, 41(2): 384-389. DOI: 10.11772/j.issn.1001-9081.2020060962

摘要 ( )

PDF (1767KB) ( )

参考文献 | 相关文章 | 计量指标

为了提高利用图像处理技术进行四轴飞行器避障的实时性，提出一种基于贝叶斯估计与区域划分遍历的避障路径规划算法。首先，通过贝叶斯估计来对四轴飞行器采集到的视频图像进行预处理；其次，对采集到的图像进行障碍物概率分析以获取视频图像中的关键帧，最大限度地提高四轴飞行器的实时性；最后，对选取的图像帧进行背景差分实现障碍物识别，并通过实现基于区域划分的像素点遍历算法提高障碍物识别的准确性。实验结果表明，在保证障碍物识别性能的前提下，所提算法使四轴飞行器进行避障时的实时性有所提升，且四轴飞行器的理想轨迹与实际飞行轨迹的最大距离为25.6 cm，最小距离为0.2 cm。可见所提出的避障路径规划算法为四轴飞行器利用摄像头采集的视频图像进行避障提供了一种高效的解决方案。

基于改进遗传算法的无人机路径规划

黄书召, 田军委, 乔路, 王沁, 苏宇

2021, 41(2): 390-397. DOI: 10.11772/j.issn.1001-9081.2020060797

摘要 ( )

PDF (1487KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统遗传算法收敛速度慢、容易陷入局部最优、规划路径不够平滑、代价高等问题，提出了一种基于改进遗传算法的无人机（UAV）路径规划方法，该算法对遗传算法的选择算子、交叉算子和变异算子进行改进，从而规划出平滑、可飞的路径。首先，建立适合UAV田间信息获取的环境模型，并考虑UAV的目标函数与约束条件以建立适合本场景的更为复杂、精确的数学模型；然后，提出了混合无重串选择算子、非对称映射交叉算子和启发式多次变异算子，寻找最优路径以及扩大种群搜索范围；最后，采用三次B样条曲线对规划出的路径进行平滑，得到平滑的飞行路径，并且减少了算法的计算时间。实验结果表明，与传统遗传算法相比，所提算法的代价值降低了68%，收敛迭代次数减少了67%；相较蚁群优化（ACO）算法，其代价值降低了55%，收敛迭代次数减少了58%。通过大量对比实验得出，当交叉率的值为（1/染色体长度）时，算法的收敛效果最好。在不同环境下进行算法性能测试，结果表明所提算法具有很好的环境适应性，适合于复杂环境下的路径规划。

基于动态和静态偏好的兴趣点推荐算法

杨丽, 王时绘, 朱博

2021, 41(2): 398-406. DOI: 10.11772/j.issn.1001-9081.2020050677

摘要 ( )

PDF (1355KB) ( )

参考文献 | 相关文章 | 计量指标

针对大多数现有主流兴趣点（POI）推荐算法忽略了融合用户复杂动态偏好和一般静态偏好建模的复杂性问题，提出一个融合复杂动态用户偏好和一般静态用户偏好的POI推荐算法CLSR。首先，在复杂动态偏好建模过程中，基于用户的签到行为及其中的跳过行为设计一个混合神经网络，实现用户的复杂动态兴趣的建模；其次，在一般静态偏好建模过程中，利用高阶注意力网络学习用户与POI之间复杂的交互关系；然后，利用多层神经网络进一步学习和表示上述动态偏好和静态偏好；最后，基于统一的POI推荐框架对偏好进行整合。在真实数据集上的实验结果表明，与个性化马尔可夫链和用户位置受限的推荐方法FPMC-LR、基于个性化排名度量嵌入的推荐方法PRME、基于排名的地理分解兴趣点推荐方法Rank-GeoFM和基于时间和多级上下文注意力机制的下一个兴趣点推荐方法TMCA相比，CLSR的性能有了较大的提高，该算法的准确率、召回率和归一化折损累计增益（nDCG）和对比方法中较优的TMCA相比，在Foursquare数据集上分别提高了5.8%、5.1%和7.2%，在Gowalla数据集上分别提高了7.3%、10.2%和6.3%，可以有效地改善POI推荐的结果。

结合ALBERT和双向门控循环单元的专利文本分类

温超东, 曾诚, 任俊伟, 张

2021, 41(2): 407-412. DOI: 10.11772/j.issn.1001-9081.2020050730

摘要 ( )

PDF (979KB) ( )

参考文献 | 相关文章 | 计量指标

随着专利申请数量的快速增长，对专利文本实现自动分类的需求与日俱增。现有的专利文本分类算法大都采用Word2vec和全局词向量（GloVe）等方式获取文本的词向量表示，舍弃了大量词语的位置信息且不能表示出文本的完整语义。针对上述问题，提出了一种结合ALBERT和双向门控循环单元（BiGRU）的多层级专利文本分类模型ALBERT-BiGRU。该模型使用ALBERT预训练的动态词向量代替传统Word2vec等方式训练的静态词向量，提升了词向量的表征能力；并使用BiGRU神经网络模型进行训练，最大限度保留了专利文本中长距离词之间的语义关联。在国家信息中心公布的专利数据集上进行有效性验证，与Word2vec-BiGRU和GloVe-BiGRU相比，ALBERT-BiGRU的准确率在专利文本的部级别分别提高了9.1个百分点和10.9个百分点，在大类级别分别提高了9.5个百分点和11.2个百分点。实验结果表明，ALBERT-BiGRU能有效提升不同层级专利文本的分类效果。

可验证的隐私保护k-means聚类方案

张恩, 李会敏, 常键

2021, 41(2): 413-421. DOI: 10.11772/j.issn.1001-9081.2020060766

摘要 ( )

PDF (1269KB) ( )

参考文献 | 相关文章 | 计量指标

针对现有云外包隐私保护k-means聚类方案存在的效率不高，以及当云服务器不可信或遭受黑客攻击时返回不合理聚类结果的问题，提出了一种可应用于多方隐私保护场景的云外包可验证隐私保护k-means聚类方案。首先，提出了一种适用于云外包场景的改进的聚类初始化方法，从而有效提高算法的迭代效率；然后，利用乘法三元组技术来设计安全欧几里得距离的计算，并利用混淆电路技术来设计安全计算最小值算法；最后，提出了一种验证算法，使用户仅需一轮通信就实现对聚类结果的验证，并且数据外包后算法的训练完全在云上进行，能够有效减少用户和云的交互。仿真实验表明，所提方案在数据集Synthetic和S1上的准确度分别达到97%和93%，说明隐私保护下的k-means聚类和明文k-means聚类的情况近似，适用于医疗、社会科学和商业等领域。

面向资源受限用户的高效动态数据审计方案

李秀艳, 刘明曦, 史闻博, 董国芳

2021, 41(2): 422-432. DOI: 10.11772/j.issn.1001-9081.2020050614

摘要 ( )

PDF (1658KB) ( )

参考文献 | 相关文章 | 计量指标

物联网（IoT）设备推动着云存储外包数据服务的快速发展，从而使云存储外包数据服务得到越来越多终端用户的青睐，因此如何确保云服务器中用户数据的完整性验证成为一个亟待解决的热点问题。针对资源受限的用户，目前的云数据审计方案存在运算复杂、开销高和效率低等问题。为了解决这些问题，提出一个面向资源受限用户的高效动态数据审计方案。首先提出一个支持动态审计的NCBF-M-MHT数据结构，其中：新颖的计数布隆过滤器（NCBF）结构能在O（1）时间内实现数据的动态更新请求，从而保证审计的高效性；多棵Merkle哈希树（M-MHT）结构的根节点则通过用户身份验证进行签名，进而保证数据的安全性。然后对审计各实体采用不同的分配方式，并使用数据证据和标签证据来验证数据的正确性和完整性。实验结果表明，相比基于动态哈希表的审计方案（DHT Audit）、基于MHT的审计方案（MHT Audit）和基于位置数组双向链接信息表的审计方案（LA-DLIT Audit），所提出的方案在审计验证阶段的时间开销分别降低了45.40%、23.71%和13.85%，在动态更新阶段的时间开销分别降低了43.33%、27.50%和17.58%。

基于改进的一维卷积神经网络的异常流量检测

杭梦鑫, 陈伟, 张仁杰

2021, 41(2): 433-440. DOI: 10.11772/j.issn.1001-9081.2020050734

摘要 ( )

PDF (1011KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统机器学习方法对特征依赖大、基于深度学习的检测方法效率低以及易过拟合的问题，提出一种基于改进的一维卷积神经网络（ICNN-1D）的异常流量检测方法（AFM-ICNN-1D）。与传统卷积神经网络（CNN）采用的“卷积-池化-全连接”结构不同，ICNN-1D主要由2个卷积层、2个全局池化层、1个dropout层和1个全连接输出层构成；其次，将预处理后的数据输入到ICNN-1D中，并将经过两次卷积之后的结果作为全局平均池化层与全局最大池化层的输入，之后将所得到的输出数据进行合并再送入全连接层进行分类；最后根据分类结果与真实数据对网络模型进行调优，再将训练好的模型用于异常流量检测。CIC-IDS-2017数据集上的实验结果显示，AFM-ICNN-1D的精准率和召回率均达到了98%，优于对比的k近邻（kNN）和随机森林（RF）方法；而且与传统的CNN相比，该方法的参数减少了约97%，训练时间缩短了约40%。实验结果表明，AFM-ICNN-1D具有较高的检测性能，能减少训练时间、避免过拟合现象的发生，而且能更好地保留流量数据的局部特征。

基于显著性检测的图像隐写分析方法

黄思远, 张敏情, 柯彦, 毕新亮

2021, 41(2): 441-448. DOI: 10.11772/j.issn.1001-9081.2020081323

摘要 ( )

PDF (1782KB) ( )

参考文献 | 相关文章 | 计量指标

针对图像隐写分析难度大、现有的检测模型难以对图像隐写区域进行针对性检测的问题，提出了一种基于显著性检测的图像隐写分析方法。该方法利用显著性检测技术引导隐写分析模型更加关注图像隐写区域的特征。首先，显著性检测模块生成图像的显著性区域；其次，区域筛选模块筛选出与隐写区域重合度较高的显著性图，利用图像融合技术与原始图像进行融合；最后，用相应的显著性融合图替换检测错误的图像，提高训练集质量，从而提升模型的训练效果和检测能力。实验使用BOSSbase1.01数据集，分别用空域和JPEG域的自适应隐写算法对数据集嵌入后进行隐写分析，结果表明，该方法能够有效提升现有基于深度学习的隐写分析模型的检测准确率，最多可提升3个百分点。为了进一步验证该方法的泛化性和提高其实用价值，在IStego100K数据集上进行了模型失配测试，测试结果也表明该方法具有一定的泛化能力。

融合残差网络和极限梯度提升的音频隐写检测模型

陈朗, 王让定, 严迪群, 林昱臻

2021, 41(2): 449-455. DOI: 10.11772/j.issn.1001-9081.2020060775

摘要 ( )

PDF (1165KB) ( )

参考文献 | 相关文章 | 计量指标

针对目前音频隐写检测方法对基于校验网格编码（STC）的音频隐写检测准确较低的问题，考虑到卷积神经网络（CNN）在抽象特征提取上的优势，提出一种融合深度残差网络（DRN）和极限梯度提升（XGBoost）的音频隐写检测模型。首先，利用固定参数的高通滤波器（HPF）预处理输入的音频，并通过三个卷积层提取特征，其中第一个卷积层使用了截断线性单元（TLU）激活函数，使得模型适应低信噪比（SNR）下的隐写信号分布；其次，通过五个阶段的残差块和池化操作进一步提取抽象特征；最后，经过全连接层和Dropout层将提取的高维特征作为XGBoost模型的输入进行分类。分别对STC隐写和最低有效位匹配（LSBM）隐写进行检测，实验结果表明，所提出的模型在0.5 bps、0.2 bps、0.1 bps三种嵌入率下，即音频每个采样值平均修改的比特数分别为0.5、0.2、0.1时，对子校验矩阵高度为7的STC隐写的平均检测准确率分别为73.27%、70.16%、65.18%，对LSBM隐写的平均检测准确率分别为86.58%、76.08%、72.82%。相较于传统提取手工特征的隐写检测方法和深度学习隐写检测方法，所提模型对两种隐写算法的平均检测准确率均提高了10个百分点以上。

基于H.266/通用视频编码的帧内双模式的视频水印算法

罗志伟, 刘持标

2021, 41(2): 456-460. DOI: 10.11772/j.issn.1001-9081.2020050603

摘要 ( )

PDF (1212KB) ( )

参考文献 | 相关文章 | 计量指标

针对现有水印算法对编码器造成较大的率失真损失的问题，结合通用视频编码（VVC）标准，提出了一种基于帧内预测模式奇偶性的视频水印算法。首先，进行第一轮粗选来计算35种偶数角度模式，并从中选出6个模式；其次，在进行第二轮粗选时，根据二值水印状态来决定是否计算第二轮粗选的奇数模式；接着，在进行矩阵加权帧内预测（MIP）和最可能模式（MPM）候选列表时，根据二值水印状态决定计算奇数模式或偶数模式；最后，选择具有最小率失真代价的模式作为最优模式以完成水印的嵌入，然后由解码端根据收到的4×4块的预测模式的奇偶性提取出水印。对9个视频序列嵌入水印，与原始编码器的算法相比，所提算法的峰值信噪比（PSNR）平均下降了0.005 4 dB，码率平均上升了0.07%，每帧可嵌入的水印容量平均为625 b；与同样将水印嵌入预测模式的奇偶性的算法相比，所提算法的PSNR平均下降了0.005 dB，码率平均上升了0.06%，可嵌入的水印总容量平均为3 183 b，而对比算法的PSNR平均下降了0.035 dB，码率平均上升了1.12%，可嵌入的水印总容量平均为10 309 b。实验结果表明所提算法损失的率失真性能小于对比算法。

基于新颖S型转换函数的二进制粒子群优化算法求解具有单连续变量的背包问题

王泽昆, 贺毅朝, 李焕哲, 张发展

2021, 41(2): 461-469. DOI: 10.11772/j.issn.1001-9081.2020050710

摘要 ( )

PDF (1113KB) ( )

参考文献 | 相关文章 | 计量指标

为了高效求解具有单连续变量的背包问题（KPC），首先基于高斯误差函数提出了一个新颖S型转换函数，给出了利用该转换函数将一个实向量转换为0-1向量的新方法，由此提出了一个新的二进制粒子群优化（NBPSO）算法；然后，利用KPC的第二数学模型，并且把NBPSO与处理KPC不可行解的有效算法相结合，提出了求解KPC的一个新方法。为了检验NBPSO求解KPC的性能，利用NBPSO求解四类大规模KPC实例，并把所得计算结果与基于其他S、V型转换函数的二进制粒子群优化算法（BPSO）、具有混合编码的单种群二进制差分演化算法（S-HBDE）、具有混合编码的双种群二进制差分演化算法（B-HBDE）和二进制粒子群优化算法（BPSO）等的计算结果相比较。比较结果表明NBPSO不仅平均计算结果更优，而且稳定性更佳，说明NBPSO的性能比其他算法有显著提升。

受春秋战国史实启发的帝国竞争改进算法

王贵林, 李斌

2021, 41(2): 470-478. DOI: 10.11772/j.issn.1001-9081.2020060974

摘要 ( )

PDF (2395KB) ( )

参考文献 | 相关文章 | 计量指标

针对帝国竞争算法过早收敛导致的求解高维函数时易陷入维数灾难的问题，受我国春秋战国时期诸侯国争雄称霸史实启发，提出了一种改进的帝国竞争算法。首先，在初始化国家阶段引入“合纵连横”竞争机制，以增强信息交互，保留较优种群；其次，在帝国同化过程中借鉴由国家各层面逐步渗透同化的殖民统治策略，以提升算法的开发能力；最后，加入判断并跳出局部最优的机制，避免“早熟”影响寻优性能。仿真实验中，利用8个经典标准函数验证改进算法的寻优能力、收敛速度及高维函数适用性，并对比分析三种跳出局部最优的方案；此外进行CEC2017测试函数实验，选取近年来在算法改进研究领域具有代表性的5种先进算法和所提改进算法进行比较，结果显示改进算法的寻优精度较高并且稳定性较强；而经Kendall相关系数分析可知，改进算法与原始算法在寻优性能上具有显著差异并且同化改进措施在性能提高中的贡献度最大。

基于准反向变异的实数笛卡尔遗传编程算法

付安兵, 魏文红, 张宇辉, 郭文静

2021, 41(2): 479-485. DOI: 10.11772/j.issn.1001-9081.2020060791

摘要 ( )

PDF (1178KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统笛卡尔遗传编程（CGP）算法变异操作多样性的缺乏以及其使用的进化策略本身的局限性，提出了一种基于准反向变异的实数笛卡尔遗传编程算法（AD-RVCGP）。首先，和传统CGP一样，AD-RVCGP在进化过程中采用1+λ的进化策略，即由一个父代个体只通过变异操作产生λ个子代个体；其次，该算法在进化过程中动态选择准反向变异算子、末端变异算子和单点变异算子，并且利用反向个体的信息进行变异操作；最后，算法在进化过程中根据进化阶段的状态来选择不同的父代个体用于生成下一代个体。在符号回归问题的测试上，相较于传统CGP，AD-RVCGP的收敛加快了约30%，运行时间少了约20%；另外该算法求得的最优解与真实最优解误差更小。实验结果表明，AD-RVCGP具有较高的收敛速度和问题求解精度。

统一计算设备架构下的F-X域预测滤波并行算法

杨先凤, 贵红军, 傅春常

2021, 41(2): 486-491. DOI: 10.11772/j.issn.1001-9081.2020050688

摘要 ( )

PDF (1373KB) ( )

参考文献 | 相关文章 | 计量指标

针对传统F-X域预测滤波去除地震资料随机噪声耗时巨大的问题，提出了基于统一计算设备架构（CUDA）的并行算法。首先，对算法进行模块化分析以找到算法的计算瓶颈；然后从每个窗口数据计算相关矩阵、求滤波因子、滤波等步骤入手，使用图形处理器（GPU）将滤波过程分解为多个任务并行处理；最后，对算法进行并行实现，并对相邻滤波窗口的数据冗余读取进行优化以提升算法效率。基于NVIDIA Tesla K20c显卡的实验结果表明，在250×250大小工区的地震数据中，所提并行算法较原串行算法在效率上实现了10.9倍的提升，同时能保证工程中要求的计算精度。

基于萤火虫算法的无线传感器网络节点重部署策略

孙环, 陈宏滨

2021, 41(2): 492-497. DOI: 10.11772/j.issn.1001-9081.2020060803

摘要 ( )

PDF (994KB) ( )

参考文献 | 相关文章 | 计量指标

节点部署是无线传感器网络研究的重要问题之一。针对节点部署过程中的能量空洞问题，提出了一种基于萤火虫算法（FA）的节点重部署（NRBFA）策略。首先，在节点随机部署的传感器网络中，利用k-means算法进行分簇并引入冗余节点；然后，利用FA移动冗余节点，以分担簇头（CH）负载并均衡网络中节点的能耗；最后，再次利用FA寻找目标节点，从而更新冗余节点。该策略通过有效地移动冗余节点，减小了节点移动距离并降低了网络能耗。实验结果表明，该策略能够有效地缓解“能量空洞”问题，并且与基于虚拟力的分区节点重部署算法相比降低了算法的复杂性，且能更好地提高网络的能量效率，均衡网络负载，并将网络生命周期延长近10倍。

基于车车通信的前向碰撞预警策略

惠飞, 邢美华, 郭静, 唐书宇

2021, 41(2): 498-503. DOI: 10.11772/j.issn.1001-9081.2020060773

摘要 ( )

PDF (1325KB) ( )

参考文献 | 相关文章 | 计量指标

针对车车（V2V）通信下前向碰撞预警（FCW）系统延时时间内，传统模型假定主车匀速和全球定位系统（GPS）无误差从而明显低估碰撞风险的问题，提出了一种修正GPS误差及考虑延时时间内主车运动状态的FCW策略。首先，分析了基于V2V通信的FCW系统的整体工作流程，并对其中的关键延时采用高斯模型进行建模；其次，确立了修正GPS误差并考虑延时时间内主车运动状态的碰撞避免模型，并根据远车匀速、加速、减速分为三种不同场景制定相应的预警策略；最后，针对延时时间内主车加速运动的情形，通过Matlab对提出的FCW策略进行仿真。仿真结果显示该预警策略的平均成功避撞率可达96%，表明了它在不同场景下预警的有效性。

图像和视频的低多边形渲染

韩艳茹, 尹梦晓, 覃子轩, 苏鹏, 杨锋

2021, 41(2): 504-510. DOI: 10.11772/j.issn.1001-9081.2020050626

摘要 ( )

PDF (9250KB) ( )

参考文献 | 相关文章 | 计量指标

低多边形是近来艺术设计界的热门风格。为了提高图像和视频低多边形风格化的质量，提出一种基于边缘特征和超像素分割的图像和视频低多边形渲染方法。首先提取相邻超像素的交点以及对特征边和超像素边界的差集的均匀采样点作为三角网格顶点，并执行Delaunay三角剖分来生成初始三角网格；然后采用带约束的二次误差度量方法对生成的网格进行简化，以生成最终三角网格；最后对三角网格填充颜色，得到了具有低多边形风格的图像。对于视频低多边形渲染，使用时间一致性超像素跨帧跟踪同一对象的相同部分，以建立视频帧之间的关联，降低视频渲染后的抖动。此外，采用视频分割方法分割视频中的移动对象，获得移动对象与背景之间不同密度的采样点，对移动对象进行渲染获从而得到视频的局部风格化效果。实验结果表明，所提方法能够生成具有较好视觉效果的低多边形渲染结果。

基于加权相似性度量的特征匹配方法

胡立华, 左威健, 聂瑶瑶

2021, 41(2): 511-516. DOI: 10.11772/j.issn.1001-9081.2020050747

摘要 ( )

PDF (1365KB) ( )

参考文献 | 相关文章 | 计量指标

针对图像特征匹配过程中采集图像易受噪声、光照、尺度等因素影响使产生的匹配结果鲁棒性差、误匹配率高等问题，提出一种基于加权相似性度量（WSM）的特征匹配方法。该方法首先采用基于网格多密度聚类的特征匹配（FM_GMC）算法对原始图像进行特征聚类块划分；其次在每一特征聚类块中，采用Canny提取边缘特征点并使用尺度不变特征变换（SIFT）进行描述；然后采用加权的方式对特征聚类块之间的空间上下文信息间的Hausdorff距离、图像特征点外观描述子间的欧氏距离以及图像特征点的局部几何灰度信息的归一化互相关度量（NCC）进行相似性度量；最后依据最近邻距离比值（NNDR）对相似性度量结果进一步优化，从而确定特征匹配结果。以古建筑图像为数据集的实验结果表明WSM方法的平均匹配精确率达到92%，在匹配数量和精确率上优于常用的特征匹配方法，验证了该方法的有效性和鲁棒性。

基于单点多盒检测器的全局-局部层级的域适应目标检测

蒋宁, 方景龙, 杨庆

2021, 41(2): 517-522. DOI: 10.11772/j.issn.1001-9081.2020050622

摘要 ( )

PDF (1199KB) ( )

参考文献 | 相关文章 | 计量指标

在目标检测领域里通常希望在拥有大量标记的场景中训练好的模型能够应用在无标记的其他场景中，但是不同的域分布往往是不同的，这样往往导致域迁移时模型性能的急剧下降。为了提高域迁移时模型的目标检测性能，通过两个层级来解决域迁移问题，包括全局层级迁移和局部层级迁移。这两种层级迁移分别对应不同的特征对齐方式，即全局层级采用选择性对齐方式，局部层级采用完全对齐方式。所提域迁移框架基于单点多盒检测器（SSD）模型，在全局和局部层级分别配置相应的域适配器以减少域间差异，通过对抗网络算法实现具体训练，再通过一致性正则化来进一步提高模型的域迁移性能。通过大量实验验证了提出的域迁移模型的有效性，结果表明同目前常见的域适应-快速区域卷积（DA-FRCNN）模型、对抗识别域适应（ADDA）模型以及动态对抗适应网络（DAAN）模型等三种域迁移模型相比，该模型在不同数据集上的均值平均精度（mAP）可以提高5%~10%。

基于孪生区域候选网络的无人机指定目标跟踪

钟莎, 黄玉清

2021, 41(2): 523-529. DOI: 10.11772/j.issn.1001-9081.2020060762

摘要 ( )

PDF (1689KB) ( )

参考文献 | 相关文章 | 计量指标

基于孪生网络的目标跟踪目前取得了阶段性进展，即克服了孪生网络的空间不变性在深度网络中的限制，然而其仍存在外观变化、尺度变化、遮挡等因素影响跟踪性能。针对无人机（UAV）指定目标跟踪中的目标尺度变化大、目标运动模糊及目标尺度小等问题，提出了基于孪生区域候选注意力机制网络的跟踪算法Attention-SiamRPN+。首先，采用改进的深度残差网络ResNet-50作为特征提取器来提取特征；接着，使用通道注意力机制模块筛选残差网络提取出的不同通道特征图的语义属性，并重新为不同通道特征分配相应权值；然后，两个区域候选网络（RPN）进行分层融合，而RPN模块包括特征图的逐通道深度互相关、正负样本分类和边界框回归；最后框选出目标位置。在VOT2018平台上进行测试，所提算法的准确率和预期平均重叠率（EAO）分别为59.4%和39.5%；在OTB2015平台上采用一次通过评估模式进行实验，该算法的成功率和精度分别为68.7%和89.4%。实验结果表明所提算法的评估结果优于近年优秀的三种相关滤波跟踪算法和孪生网络跟踪算法，且该算法应用于UAV指定目标的跟踪上时具有良好的鲁棒性和实时处理速度。

基于非局部关注和多重特征融合的视频行人重识别

刘紫燕, 朱明成, 袁磊, 马珊珊, 陈霖周廷

2021, 41(2): 530-536. DOI: 10.11772/j.issn.1001-9081.2020050739

摘要 ( )

PDF (1057KB) ( )

参考文献 | 相关文章 | 计量指标

现有视频行人重识别方法无法有效地提取视频连续帧之间的时空信息，因此提出一种基于非局部关注和多重特征融合的行人重识别网络来提取全局与局部表征特征和时序信息。首先嵌入非局部关注模块来提取全局特征；然后通过提取网络的低中层特征和局部特征实现多重特征融合，从而获得行人的显著特征；最后将行人特征进行相似性度量并排序，计算出视频行人重识别的精度。在大数据集MARS和DukeMTMC-VideoReID上进行实现，结果显示所提出的模型较现有的多尺度三维卷积（M3D）和学习片段相似度聚合（LCSA）模型的性能均有明显提升，平均精度均值（mAP）分别达到了81.4%和93.4%，Rank-1分别达到了88.7%和95.3%；同时在小数据集PRID2011上，所提模型的Rank-1也达到94.8%。

基于多尺度空间注意力特征融合的人群计数网络

杜培德, 严华

2021, 41(2): 537-543. DOI: 10.11772/j.issn.1001-9081.2020060793

摘要 ( )

PDF (1581KB) ( )

参考文献 | 相关文章 | 计量指标

针对严重的尺度变化和遮挡导致在不同密集场景人群计数任务中性能差的问题，在密集场景识别网络（CSRNet）的基础上通过增加多尺度特征融合结构并引入空间注意力机制，提出了一种多尺度空间注意力特征融合网络（MAFNet）。在MAFNet进行特征提取之前，需要对添加了人头标记的场景图进行高斯滤波生成真实密度图；此外，MAFNet还通过联合使用两种基本损失函数的方法来约束密度估计图与真实密度图的一致性。接着，MAFNet以多尺度特征融合结构为主干，首先采用边提取多尺度特征边融合的策略得到多尺度融合特征图，然后使用空间注意力模块对特征图进行校准和再融合，之后通过扩张卷积生成密度估计图，最后对密度估计图逐像素积分得到场景中的人数。为了验证所提出模型的有效性，在四个人群计数数据集（ShanghaiTech、UCF_CC_50、UCF_QRNF和World-Expo’10）上进行了评估。其中ShanghaiTech数据集PartB的实验结果显示，MAFNet与CSRNet相比，平均绝对误差（MAE）降低了34.9%，均方误差（MSE）降低了29.4%。在多个数据集上的实验结果表明，采用注意力机制和多尺度特征融合策略使MAFNet可以提取更多细节信息，减少尺度变化和遮挡带来的影响。

基于空间维度循环感知网络的密集人群计数模型

付倩慧, 李庆奎, 傅景楠, 王羽

2021, 41(2): 544-549. DOI: 10.11772/j.issn.1001-9081.2020050623

摘要 ( )

PDF (1486KB) ( )

参考文献 | 相关文章 | 计量指标

考虑目前对具有透视畸变的高密度人群图像进行特征提取的局限性，提出了一种融合全局特征感知网络（GFPNet）和局部关联性特征感知网络（LAFPNet）的人群计数模型LMCNN。GFPNet是LMCNN的主干网络，将其输出的特征图进一步序列化并作为LAFPNet的输入，再利用循环神经网络（RNN）在时序维度上对局部关联性特征感知的特点将单一的空间静态特征映射到具有局部序列关联性特征的特征空间，从而有效地削减了透视畸变对人群密度估计造成的影响。为了验证所提模型的有效性，在Shanghaitech Part A子集和UCF_CC_50数据集上与原子卷积空间金字塔网络（ACSPNet）进行对比，结果表明所提模型的平均绝对误差（MAE）分别至少减小了18.7%和20.30%，均方误差（MSE）分别至少减小了22.3%和22.6%。LMCNN注重空间维度上前后特征的相关性，通过对空间维度特征与单图像内序列特征的充分融合，减小了由透视畸变引起的人群计数误差，能更加准确地预测密集区域人数，提高人群密度回归精度。

基于标签分布学习的三维手部姿态估计

李伟强, 雷航, 张静玉, 王旭鹏

2021, 41(2): 550-555. DOI: 10.11772/j.issn.1001-9081.2020050721

摘要 ( )

PDF (1109KB) ( )

参考文献 | 相关文章 | 计量指标

快速、可靠的手部姿态估计在人机交互等领域有着广泛的应用。为了解决光照强度变化、自身遮挡以及姿态变化幅度较大等情况对手部姿态估计的影响，提出了一种基于标签分布学习的深度网络结构。该网络将手部点云作为输入数据，首先通过最远点采样和定向边界框（OBB）对点云数据进行归一化处理，然后采用PointNet++提取手部点云数据特征。为了应对点云数据与手部关节点之间的高度非线性关系，通过标签分布学习网络预测手部关节点的位置信息。与传统的基于深度图的方法相比，该方法能够高效地提取高鉴别力的手部几何特征，并且计算复杂度较低、精确度较高。为了验证提出的手部姿态估计网络的有效性，在公共数据集MSRA上进行了一系列测试。实验结果表明，该网络估计出的手部关节点位置的平均误差为8.43 mm，平均每帧的处理时间为12.8 ms，而且姿态估计的误差相较于3D CNN算法降低了11.82%，相较于Hand PointNet算法降低了0.83%。

基于注意力机制的两阶段纵膈淋巴结自动分割算法

徐少伟, 秦品乐, 曾建朝, 赵致楷, 高媛

2021, 41(2): 556-562. DOI: 10.11772/j.issn.1001-9081.2020060809

摘要 ( )

PDF (2390KB) ( )

参考文献 | 相关文章 | 计量指标

判断淋巴结分区是否存在淋巴结转移以及准确分割恶性淋巴结对于肺癌诊断以及治疗意义重大。针对纵膈淋巴结尺寸差异大、正负样本不平衡、与周边软组织和肺肿瘤特征相似等问题，提出了一个新颖的用于纵膈淋巴结分割的基于注意力机制的级联算法。首先，根据医学先验设计了两阶段分割算法剔除纵膈干扰组织后对疑似淋巴结进行分割，减少负样本的影响和训练难度，同时增强对纵膈淋巴结的分割能力；然后，引入全局聚合模块和双注意力模块以提升网络对多尺度目标和背景的分类能力。实验结果表明，提出的算法在纵膈淋巴结数据集上的准确率达到0.707 9，召回率达到0.726 9，Dice score达到 0.701 1，在准确率和Dice score上均明显优于当前其他纵膈淋巴结分割算法，能较好地解决淋巴结尺寸差异大、样本不平衡、特征易混淆等问题。

基于超像素快速模糊C均值聚类与支持向量机的柑橘病虫害区域分割

袁芊芊, 邓洪敏, 王晓航

2021, 41(2): 563-570. DOI: 10.11772/j.issn.1001-9081.2020050645

摘要 ( )

PDF (1737KB) ( )

参考文献 | 相关文章 | 计量指标

针对目前柑橘病虫害图像数据集较少，病虫害目标复杂、散漫，难以自动定位分割的问题，提出了一种基于超像素快速模糊C均值聚类（SFFCM）与支持向量机（SVM）的农业柑橘病虫害区域分割方法。该方法充分利用了SFFCM快速、鲁棒的优点，且融合了空间信息的特点，同时避免了传统SVM在图像分割上需要人工选择样本的缺点。首先，利用改进的SFFCM分割算法对待分割图像进行预分割，得到前景和背景区域；接着利用形态学中的腐蚀和膨胀操作对前景和背景区域进行缩小，然后自动选取训练样本进行SVM模型训练；最后用训练好的SVM分类器完成整幅图像的分割。将所提方法与快速鲁棒模糊C均值聚类（FRFCM）、原始SFFCM及边缘引导网络（EGNet）这三种方法进行实验对比，结果表明所提方法的平均召回率为0.937 1，平均精确率为0.941 8，平均准确率为0.930 3，均明显优于对比算法。

基于层级控制的宏观基本图交通信号控制模型

王鹏, 李艳雯, 杨迪, 杨华民

2021, 41(2): 571-576. DOI: 10.11772/j.issn.1001-9081.2020050758

摘要 ( )

PDF (1351KB) ( )

参考文献 | 相关文章 | 计量指标

针对城市交通子区内部与边界交叉口的协调控制问题，提出基于分层多粒度与宏观基本图的交通信号控制模型HDMF。首先利用城市交通系统的分层多粒度特性与粗糙集理论描述交通要素的实时状态；然后结合基于背压算法的分布式交叉信号控制和交通元素的动态特性，计算交叉口相位压力并对相位进行决策；最后使用宏观基本图（MFD）实现区域驶出总流量最大和各子区内存在车辆数量最优。实验结果显示，HDMF模型与协同最大压力控制模型EMP、基于MFD和混合遗传模拟退火算法的HGA模型相比，平均排队长度分别降低了6.35%和10.01%，平均行程时间分别降低了6.55%和11.15%，表明HDMF模型能够有效疏导子区域内部与边界的交通，实现整体路网的车流量最大化。

带约束的清洁排班问题模型及其求解

樊小毛, 熊红林, 赵淦森

2021, 41(2): 577-582. DOI: 10.11772/j.issn.1001-9081.2020050735

摘要 ( )

PDF (876KB) ( )

参考文献 | 相关文章 | 计量指标

保洁服务公司的清洁任务往往具有不同级别、不同时长和不同周期等特点，缺乏通用清洁排班问题模型，现阶段主要依赖人工排班方案，存在耗时费力且排班质量不稳定等问题。因此提出了属于NP难问题的带约束的清洁排班问题的数学模型，并使用模拟退火算法（SA）、蜂群算法（BCO）、蚁群算法（ACO）和粒子群优化算法（PSO）对该模型进行求解，最后以某清洁服务公司实际排班情况进行了实证分析。实验结果表明，与人工排班方案进行对比，启发式智能优化算法求解带约束的清洁排班问题具有明显优势，获得的清洁排班表的人力需求明显减少。具体来说，在一年排班周期内这些算法比人工排班方案可节省清洁人力218.62~513.30 h。可见基于启发式智能优化算法的数学模型对带约束的清洁排班问题的求解可行且有效，能为保洁服务公司提供科学管理的决策支持。

融合运动特征和深度学习的跌倒检测算法

曹建荣, 吕俊杰, 武欣莹, 张旭, 杨红娟

2021, 41(2): 583-589. DOI: 10.11772/j.issn.1001-9081.2020050705

摘要 ( )

PDF (1348KB) ( )

参考文献 | 相关文章 | 计量指标

为了利用计算机视觉技术准确检测老年人的跌倒状况，针对现有跌倒检测算法中人为设计特征造成的不完备性以及跌倒检测过程中前后景分离困难、目标混淆、运动目标丢失、跌倒检测准确率低等问题，提出了一种融合人体运动信息的深度学习跌倒检测算法对人体跌倒状态进行检测。首先，通过改进YOLOv3网络进行前景与背景的分离，并根据YOLOv3网络的检测结果对前景人体目标进行最小外接矩形标记；其次，分析人体跌倒过程中的运动特征，将人体运动特征向量化并通过Sigmoid激活函数转化为0到1之间的运动权重信息；最后，通过全连接层将将运动特征与卷积神经网络（CNN）提取的特征进行拼接和融合从而实现人体跌倒分类判别。将所提跌倒检测算法与背景差分、高斯混合、VIBE、方向梯度直方图（HOG）等人体目标检测算法及阈值法、分级法、支持向量机（SVM）分类和CNN分类等人体跌倒判断方案进行了对比实验，并将所提跌倒检测算法在不同光照条件下和混合日常噪声运动干扰下进行了实验，结果表明所提算法在环境适应性和跌倒检测准确率上都优于传统的人体跌倒检测方法。该算法能有效检测出视频中的人体并对人体跌倒状态进行准确检测，进一步验证了融合运动信息的深度学习识别方法在视频跌倒行为分析上的可行性与高效性。

使用深度学习和不同频率维度的脑功能性连接对轻微认知障碍的诊断

孔伶旭, 吴海锋, 曾玉, 陆小玲

2021, 41(2): 590-597. DOI: 10.11772/j.issn.1001-9081.2020060897

摘要 ( )

PDF (1848KB) ( )

参考文献 | 相关文章 | 计量指标

准确诊断轻微认知障碍（MCI）对于阿尔兹海默症（AD）的预防和治疗十分关键，目前常使用深度学习和静息态功能核磁共振成像（rs-fMRI）对MCI进行辅助诊断。皮尔逊（Pearson）相关法和加窗的皮尔逊（WP）相关法能在时间维度上表示脑功能性连接（FC），但不能将不同频率维度上的信息进行分解表示。针对这一问题，提出将不同频率维度的FC系数作为现有深度学习的特征输入的方法，以提高MCI分类准确率。首先将被试的数据进行拼接后进行多通道经验模态分解（MEMD），然后通过切割求得不同频率维度上的FC系数，最后使用VGG16和长短期记忆（LSTM）网络进行测试。实验结果表明，使用所提出的FC系数时，MCI的分类准确率最高可达84.33%，相较使用传统FC系数时的准确率提高了18.33~21.00个百分点；而且不同频率维度的FC系数对MCI有着不同的分辨率。

基于HHT-MFCC和短时能量的慢性阻塞性肺病患者呼吸声识别

常峥, 罗萍, 杨波, 张晓晓

2021, 41(2): 598-603. DOI: 10.11772/j.issn.1001-9081.2020060881

摘要 ( )

PDF (1298KB) ( )

参考文献 | 相关文章 | 计量指标

为了优化梅尔频率倒谱系数（MFCC）特征提取算法，提高对呼吸声信号识别的准确率，实现识别慢性阻塞性肺病（COPD）的目的，提出了基于希尔伯特黄变换（HHT）的MFCC与短时能量（Energy）融合的特征提取算法HHT-MFCC+Energy。首先，经预处理的呼吸声信号通过HHT计算出Hilbert边际谱和边际谱能量；其次，谱能量通过Mel滤波器得到特征向量，再对特征向量取对数和进行离散余弦变换得到HHT-MFCC系数；最后，将信号的短时能量与HHT-MFCC特征向量融合形成新特征，并通过支持向量机（SVM）进行信号识别。将MFCC、HHT-MFCC和HHT-MFCC+Energy三种特征提取算法结合SVM进行呼吸声信号识别，实验结果表明，所提出的特征融合算法在COPD患者和健康人呼吸声识别效果上都优于其他两种算法：当提取24维特征、选取100个训练样本时，识别率平均值能达到97.8%，分别比MFCC和HHT-MFCC高出6.9个百分点和1.4个百分点。

基于加速度补偿的无人机吊挂飞行抗摆控制

焦海林, 郭玉英, 朱正为

2021, 41(2): 604-610. DOI: 10.11772/j.issn.1001-9081.2020050740

摘要 ( )

PDF (3609KB) ( )

参考文献 | 相关文章 | 计量指标

为了抑制四旋翼无人机（UAV）吊挂飞行中的载荷摆动，研究了一种新的基于加速度补偿的抗摆控制方法。首先，基于拉格朗日法建立了四旋翼UAV吊挂系统的非线性动态特性方程，并构建了能量函数来设计飞行控制系统，使四旋翼UAV跟踪参考轨迹；然后，利用吊挂载荷运动轨迹广义误差设计抗摆控制器，对四旋翼UAV进行加速度补偿以修正UAV的运动轨迹，进而抑制因四旋翼UAV快速运动造成的吊挂载荷摆动；最后，通过仿真对加速度补偿前后的UAV吊挂飞行控制效果进行对比分析。仿真结果表明，基于加速度补偿的飞行控制方法不仅能保证UAV吊挂飞行的平稳，而且能为飞行控制系统提供足够的稳定裕度。

当期目录