《计算机应用》唯一官方网站

不平衡多分类算法综述

李蒙蒙, 刘艺, 李庚松, 郑奇斌, 秦伟, 任小广

2022, 42(11): 3307-3321. DOI: 10.11772/j.issn.1001-9081.2021122060

摘要 ( )

HTML ( )

PDF (1861KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

不平衡数据分类是机器学习领域的重要研究内容，但现有的不平衡分类算法通常针对不平衡二分类问题，关于不平衡多分类的研究相对较少。然而实际应用中的数据集通常具有多类别且数据分布具有不平衡性，而类别的多样性进一步加剧了不平衡数据的分类难度，因此不平衡多分类问题已经成为亟待解决的研究课题。针对近年来提出的不平衡多分类算法展开综述，根据是否采用分解策略把不平衡多分类算法分为分解方法和即席方法，并进一步将分解方法按照分解策略的不同划分为“一对一（OVO）”架构和“一对多（OVA）”架构，将即席方法按照处理技术的不同分为数据级方法、算法级方法、代价敏感方法、集成方法和基于深度网络的方法。系统阐述各类方法的优缺点及其代表性算法，总结概括不平衡多分类方法的评价指标，并通过实验深入分析代表性方法的性能，讨论了不平衡多分类的未来发展方向。

面向高维特征缺失数据的K最近邻插补子空间聚类算法

乔永坚, 刘晓琳, 白亮

2022, 42(11): 3322-3329. DOI: 10.11772/j.issn.1001-9081.2021111964

摘要 ( )

HTML ( )

PDF (1207KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对高维特征缺失数据在聚类过程中面临的因数据高维引发的维度灾难问题和数据特征缺失导致的样本间有效距离计算失效问题，提出一种面向高维特征缺失数据的K最近邻（KNN）插补子空间聚类算法KISC。首先，利用高维特征缺失数据的子空间下的近邻关系对原始空间下的特征缺失数据进行KNN插补；然后，利用多次迭代矩阵分解和KNN插补获得数据最终可靠的子空间结构，并在该子空间结构进行聚类分析。在6个图像数据集原始空间的聚类结果表明，相较于经过插补后直接进行聚类的对比算法，KISC算法聚类效果更好，说明子空间结构能够更加容易且有效地识别数据的潜在聚类结构；在6个高维数据集子空间下的聚类结果显示，KISC算法在各个数据集的聚类性能均优于对比算法，且在大多数据集上取得了最优的聚类精确度（ACC）和标准互信息（NMI）。KISC算法能够更加有效地处理高维特征缺失数据，提高算法的聚类性能。

神经正切核K‑Means聚类

王梅, 宋晓晖, 刘勇, 许传海

2022, 42(11): 3330-3336. DOI: 10.11772/j.issn.1001-9081.2021111961

摘要 ( )

HTML ( )

PDF (2237KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对K-Means聚类算法利用均值更新聚类中心，导致聚类结果受样本分布影响的问题，提出了神经正切核K-Means聚类算法（NTKKM）。首先通过神经正切核（NTK）将输入空间的数据映射到高维特征空间，然后在高维特征空间中进行K-Means聚类，并采用兼顾簇间与簇内距离的方法更新聚类中心，最后得到聚类结果。在car和breast-tissue数据集上，对NTKKM聚类算法的准确率、调整兰德系数（ARI）及FM指数这3个评价指标进行统计。实验结果表明，NTKKM聚类算法的聚类效果以及稳定性均优于K?Means聚类算法和高斯核K-Means聚类算法。NTKKM聚类算法与传统的K-Means聚类算法相比，准确率分别提升了14.9%和9.4%，ARI分别提升了9.7%和18.0%，FM指数分别提升了12.0%和12.0%，验证了NTKKM聚类算法良好的聚类性能。

面向流式数据处理系统的高效故障恢复方法

刘阳, 张扬扬, 周号益

2022, 42(11): 3337-3345. DOI: 10.11772/j.issn.1001-9081.2021122108

摘要 ( )

HTML ( )

PDF (2031KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对流式数据处理系统Flink无法高效处理单点故障的问题，提出了一种基于增量状态和备份的故障容错系统Flink+。首先，提前建立备份算子和数据通路；然后，对数据流图中的输出数据进行缓存，必要时使用磁盘；其次，在系统快照时进行任务状态同步；最后，在系统故障时使用备份任务和缓存的数据恢复计算。在系统实验测试中，Flink+在无故障运行时没有显著增加额外容错开销；而在单机和分布式环境下处理单点故障时，与Flink系统相比，所提系统在单机8任务并行度下故障恢复时间减少了96.98%，在分布式16任务并行度下故障恢复时间减少了88.75%。实验结果表明，增量状态和备份方法一起使用可以有效减少流式系统单点故障的恢复时间，增强系统的鲁棒性。

基于注意力消息共享的多智能体强化学习

臧嵘, 王莉, 史腾飞

2022, 42(11): 3346-3353. DOI: 10.11772/j.issn.1001-9081.2021122169

摘要 ( )

HTML ( )

PDF (1668KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

通信是非全知环境中多智能体间实现有效合作的重要途径，当智能体数量较多时，通信过程会产生冗余消息。为有效处理通信消息，提出一种基于注意力消息共享的多智能体强化学习算法AMSAC。首先，在智能体间搭建用于有效沟通的消息共享网络，智能体通过消息读取和写入完成信息共享，解决智能体在非全知、任务复杂场景下缺乏沟通的问题；其次，在消息共享网络中，通过注意力消息共享机制对通信消息进行自适应处理，有侧重地处理来自不同智能体的消息，解决较大规模多智能体系统在通信过程中无法有效识别消息并利用的问题；然后，在集中式Critic网络中，使用Native Critic依据时序差分（TD）优势策略梯度更新Actor网络参数，使智能体的动作价值得到有效评判；最后，在执行期间，智能体分布式Actor网络根据自身观测和消息共享网络的信息进行决策。在星际争霸Ⅱ多智能体挑战赛（SMAC）环境中进行实验，结果表明，与朴素Actor?Critic （Native AC）、博弈抽象通信（GA?Comm）等多智能体强化学习方法相比，AMSAC在四个不同场景下的平均胜率提升了4 ~ 32个百分点。AMSAC的注意力消息共享机制为处理多智能体系统中智能体间的通信消息提供了合理方案，在交通枢纽控制和无人机协同领域都具备广泛的应用前景。

基于混合特征建模的图卷积网络方法

李卓然, 冶忠林, 赵海兴, 林晶晶

2022, 42(11): 3354-3363. DOI: 10.11772/j.issn.1001-9081.2021111981

摘要 ( )

HTML ( )

PDF (3410KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

对于网络中拥有的复杂信息，需要更多的方式抽取其中的有用信息，但现有的单特征图神经网络（GNN）无法完整地刻画网络中的相关特性。针对该问题，提出基于混合特征的图卷积网络（HDGCN）方法。首先，通过图卷积网络（GCN）得到节点的结构特征向量和语义特征向量；然后，通过改进基于注意力机制或门控机制的聚合函数选择性地聚合语义网络节点的特征，增强节点的特征表达能力；最后，通过一种基于双通道图卷积网络的融合机制得到节点的混合特征向量，将节点的结构特征和语义特征联合建模，使特征之间互相补充，提升该方法在后续各种机器学习任务上的表现。在CiteSeer、DBLP和SDBLP三个数据集上进行实验的结果表明，与基于结构特征训练的GCN相比，HDGCN在训练集比例为20%、40%、60%、80%时的Micro?F1值平均分别提升了2.43、2.14、1.86和2.13个百分点，Macro?F1值平均分别提升了1.38、0.33、1.06和0.86个百分点。用拼接或平均值作为融合策略时，准确率相差不超过0.5个百分点，可见拼接和平均值均可作为融合策略。HDGCN在节点分类和聚类任务上的准确率高于单纯使用结构或语义网络训练的模型，并且在输出维度为64、学习率为0.001、2层图卷积层和128维注意力向量时的效果最好。

基于演化模式的推特话题流行度预测方法

解伟凡, 郭岩, 匡广生, 余智华, 薛源海, 沈华伟

2022, 42(11): 3364-3370. DOI: 10.11772/j.issn.1001-9081.2022010045

摘要 ( )

HTML ( )

PDF (934KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对以往流行度预测方法未利用演化模式之间的差异和忽略预测时效性的问题，提出了一种基于演化模式的推特话题流行度预测方法。首先，基于K?SC算法对大量历史话题的流行度序列进行聚类，并得到6类演化模式；然后，使用各类演化模式下的历史话题数据分别训练全连接网络（FCN）作为预测模型；最后，为选择待预测话题的预测模型，提出幅度对齐的动态时间规整（AADTW）算法来计算待预测话题的已知流行度序列与各演化模式的相似度，并选取相似度最高的演化模式的预测模型进行流行度预测。在根据已知前20 h的流行度预测后5 h的流行度的任务中，与差分整合移动平均自回归（ARIMA）方法以及使用单一的全连接网络进行预测的方法相比，所提方法的预测结果的平均绝对百分比误差（MAPE）分别降低了58.2%和31.0%。实验结果表明，基于演化模式得到的模型群相较于单一模型能更加准确地预测推特话题流行度。

联合立场的过程跟踪式多任务谣言验证模型

张斌, 王莉, 杨延杰

2022, 42(11): 3371-3378. DOI: 10.11772/j.issn.1001-9081.2021122148

摘要 ( )

HTML ( )

PDF (1420KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

当前，社交媒体平台成为人们发布和获取信息的主要途径，但简便的信息发布也导致了谣言更容易迅速传播，因此验证信息是否为谣言并阻止谣言传播，已经成为一个亟待解决的问题。以往的研究表明，人们对信息的立场可以协助判断信息是否为谣言。在此基础上，针对谣言泛滥的问题，提出了一个联合立场的过程跟踪式多任务谣言验证模型（JSP?MRVM）。首先，分别使用拓扑图、特征图和公共图卷积网络（GCN）对信息的三种传播过程进行表征；然后，利用注意机制获取信息的立场特征，并融合立场特征与推文特征；最后，设计多任务目标函数使立场分类任务更好地协助验证谣言。实验结果表明，所提模型在RumorEval数据集上的准确度和Macro?F1较基线模型RV?ML分别提升了10.7个百分点和11.2个百分点，可以更有效地检验谣言，减少谣言的泛滥。

基于多语BERT的无监督攻击性言论检测

师夏阳, 张风远, 袁嘉琪, 黄敏

2022, 42(11): 3379-3385. DOI: 10.11772/j.issn.1001-9081.2021112005

摘要 ( )

HTML ( )

PDF (1536KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

攻击性言论会对社会安定造成严重不良影响，但目前攻击性言论自动检测主要集中在少数几种高资源语言，对低资源语言缺少足够的攻击性言论标注语料导致检测困难，为此，提出一种跨语言无监督攻击性迁移检测方法。首先，使用多语BERT（mBERT）模型在高资源英语数据集上进行对攻击性特征的学习，得到一个原模型；然后，通过分析英语与丹麦语、阿拉伯语、土耳其语、希腊语的语言相似程度，将原模型迁移到这四种低资源语言上，实现对低资源语言的攻击性言论自动检测。实验结果显示，与BERT、线性回归（LR）、支持向量机（SVM）、多层感知机（MLP）这四种方法相比，所提方法在丹麦语、阿拉伯语、土耳其语、希腊语这四种语言上的攻击性言论检测的准确率和F1值均提高了近2个百分点，接近目前的有监督检测，可见采用跨语言模型迁移学习和迁移检测相结合的方法能够实现对低资源语言的无监督攻击性检测。

基于源语言句法增强解码的神经机器翻译方法

龚龙超, 郭军军, 余正涛

2022, 42(11): 3386-3394. DOI: 10.11772/j.issn.1001-9081.2021111963

摘要 ( )

HTML ( )

PDF (1267KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

当前性能最优的机器翻译模型之一Transformer基于标准的端到端结构，仅依赖于平行句对，默认模型能够自动学习语料中的知识；但这种建模方式缺乏显式的引导，不能有效挖掘深层语言知识，特别是在语料规模和质量受限的低资源环境下，句子解码缺乏先验约束，从而造成译文质量下降。为了缓解上述问题，提出了基于源语言句法增强解码的神经机器翻译（SSED）方法，显式地引入源语句句法信息指导解码。所提方法首先利用源语句句法信息构造句法感知的遮挡机制，引导编码自注意力生成一个额外的句法相关表征；然后将句法相关表征作为原句表征的补充，通过注意力机制融入解码，共同指导目标语言的生成，实现对模型的先验句法增强。在多个IWSLT及WMT标准机器翻译评测任务测试集上的实验结果显示，与Transformer基线模型相比，所提方法的BLEU值提高了0.84~3.41，达到了句法相关研究的最先进水平。句法信息与自注意力机制融合是有效的，利用源语言句法可指导神经机器翻译系统的解码过程，显著提高译文质量。

基于用户激励的共享单车调度策略

石兵, 黄茜子, 宋兆翔, 徐建桥

2022, 42(11): 3395-3403. DOI: 10.11772/j.issn.1001-9081.2021122109

摘要 ( )

HTML ( )

PDF (2192KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对共享单车的调度问题，在考虑预算限制、用户最大步行距离限制、用户时空需求以及共享单车分布动态变化的情况下，提出一种用户激励下的共享单车调度策略，以达到提高共享单车平台长期用户服务率的目的。该调度策略包含任务生成算法、预算分配算法和任务分配算法。在任务生成算法中，使用长短期记忆（LSTM）网络预测用户未来的单车需求量；在预算分配算法中，采用深度策略梯度（DDPG）算法来设计预算分配策略；任务分配完预算后，需要将任务分配给用户执行，因此在任务分配算法中使用贪心匹配策略来进行任务分配。基于摩拜单车的数据集进行实验，并把所提策略分别与无预算限制的调度策略（即平台不受预算限制，可以使用任意金钱激励用户将车骑行至目标区域）、贪心的调度策略、卡车拖运下的调度策略以及未进行调度的情况进行对比。实验结果表明，与贪心调度策略和卡车托运下的调度策略相比，用户激励下的共享单车调度策略能有效提高共享单车系统中的用户服务率。

基于组蛋白修饰数据预测基因差异性表达的深度融合模型

李昕, 贾韬

2022, 42(11): 3404-3412. DOI: 10.11772/j.issn.1001-9081.2021111956

摘要 ( )

HTML ( )

PDF (1734KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对使用大规模组蛋白修饰（HM）数据预测基因差异性表达（DGE）时未合理利用细胞型特异性（CS）和细胞型间异同两类信息，且输入规模大、计算量高等问题，提出一种深度学习方法dcsDiff。首先，使用多个自编码器（AE）和双向长短时记忆（Bi?LSTM）网络降维，并建模HM信号得到嵌入表示；然后，利用多个卷积神经网络（CNN）分别挖掘每类CS的HM组合效应以及两细胞型间每种HM的异同信息和所有HM的联合影响；最后，融合两类信息预测两细胞型间的 DGE。在对REMC数据库中10对细胞型的实验中，与DeepDiff相比，dcsDiff的预测DGE的皮尔逊相关系数（PCC）最高提升了7.2%、平均提升了3.9%，准确检测出差异表达基因的数量最多增加了36、平均增加了17.6，运行时间节省了78.7%；进一步的成分分析实验证明了合理整合上述两类信息的有效性；并通过实验确定了算法的参数。实验结果表明dcsDiff能有效提高DGE预测的效率。

基于区块链的联邦学习研究进展

孙睿, 李超, 王伟, 童恩栋, 王健, 刘吉强

2022, 42(11): 3413-3420. DOI: 10.11772/j.issn.1001-9081.2021111934

摘要 ( )

HTML ( )

PDF (1086KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

联邦学习（FL）是一种能够实现用户数据不出本地的新型隐私保护学习范式。随着相关研究工作的不断深入，FL的单点故障及可信性缺乏等不足之处逐渐受到重视。近年来，起源于比特币的区块链技术取得迅速发展，它开创性地构建了去中心化的信任，为FL的发展提供了一种新的可能。对现有基于区块链的FL框架进行对比分析，深入讨论区块链与FL相结合所解决的FL重要问题，并阐述了基于区块链的FL技术在物联网（IoT）、工业物联网（IIoT）、车联网（IoV）、医疗服务等多个领域的应用前景。

基于自定义日志的Fabric的共识交易轨迹可视化追踪方法

李杉杉, 王岩泽, 邹英龙, 陈焕雷, 张贺, 吴欧

2022, 42(11): 3421-3428. DOI: 10.11772/j.issn.1001-9081.2021111935

摘要 ( )

HTML ( )

PDF (3301KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

联盟链缺少展示各个节点资源使用情况、健康状态、互相关系、共识交易流程等方面的可视化方法，为此提出一种基于自定义日志的Fabric共识交易轨迹追踪方法（FTL）。首先，以典型联盟链框架Hyperledger Fabric为基础设施实现区块链底层构建；然后，利用ELK工具链收集与解析Fabric的自定义共识交易日志，并利用Spring Boot作为业务逻辑处理框架；最后，采用专注于图分析领域的Graphin实现共识交易轨迹的可视化。实验结果表明，与原生Fabric应用相比，基于FTL的Fabric的应用框架在实现可视化追踪基础后，平均性能仅下降了8.8%，未造成显著延迟，可以为监管方提供更加智能的区块链监管方案。

面向时空数据的区块链构建及查询方法

华亚洲, 丁琳琳, 陈泽, 王俊陆, 朱珠

2022, 42(11): 3429-3437. DOI: 10.11772/j.issn.1001-9081.2021111933

摘要 ( )

HTML ( )

PDF (2236KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

时空数据作为一种同时具有时间维度及空间维度的数据类型，被广泛应用于供应链管理、电子商务等领域，它的完整性及安全性在实际应用中具有重要意义。针对目前时空数据集中式存储方式存在数据不透明且易被篡改的问题，将区块链技术的去中心化、防篡改、可追溯等特性与时空数据管理相结合，提出面向时空数据的区块链构建及查询方法。首先，提出一种基于改进图型区块链（Block?DAG）的时空数据区块链架构ST_Block?DAG；其次，为了提升时空数据的存储及查询效率，在ST_Block?DAG区块链内部采取基于四叉树及单链表的结构存储时空数据；最后，在ST?Block?DAG存储结构基础上实现了多种时空数据查询算法，如单值查询、范围查询等。实验结果表明，与STBitcoin、Block?DAG以及STEth相比，ST_Block?DAG的时空数据处理效率提升了70%以上，时空数据综合查询性能提升了60%以上。所提方法能够实现时空数据的快速存储及查询，可以有效支持时空数据的管理。

基于公证人组的跨链交互安全模型

蒋楚钰, 方李西, 章宁, 朱建明

2022, 42(11): 3438-3443. DOI: 10.11772/j.issn.1001-9081.2021111915

摘要 ( )

HTML ( )

PDF (1065KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对公证人机制中存在的公证人节点职能集中以及跨链交易效率较低等问题，提出一种基于公证人组的跨链交互安全模型。首先，将公证人节点分为三类角色，即交易验证者、连接者和监督者，由交易验证组成员打包经过共识的多笔交易成一笔大的交易，并利用门限签名技术对它进行签名；其次，被确认的交易会被置于跨链待转账池中，连接者随机选取多笔交易，利用安全多方计算和同态加密等技术判断交易的真实性；最后，若打包所有符合条件的交易的哈希值真实可靠且被交易验证组验证过，则连接者可以继续执行多笔跨链交易的批处理任务，并与区块链进行信息交互。安全性分析表明，该跨链机制有助于保护信息的机密性和数据的完整性，实现数据在不出库的情况下的协同计算，保障区块链跨链系统的稳定性。与传统的跨链交互安全模型相比，所提模型的签名次数和需要分配公证人组数的复杂度从 $O (n)$ 降为 $O (1)$ 。

基于联盟自治的区块链跨链机制

郑建辉, 林飞龙, 陈中育, 胡兆龙, 唐长兵

2022, 42(11): 3444-3457. DOI: 10.11772/j.issn.1001-9081.2021111922

摘要 ( )

HTML ( )

PDF (2880KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对目前区块链系统跨链互操作难问题而导致的“信息与价值孤岛”现象，提出一种基于联盟自治的区块链跨链机制。该机制的核心思想是以链治链，通过构建一条由多方共治的中继联盟链来管理跨链网络，用于解决不同区块链系统之间的数据共享、价值流通与业务协同问题。首先，提出了一个基于中继模式的跨链系统为同异构区块链系统提供交互服务；其次，详细设计了中继联盟链，设定了应用链及其用户参与跨链系统的规则；然后，总结了跨链交互的基本类型并制定了基于智能合约的跨链交互实现流程；最后，通过多组实验验证了跨链方案的可行性，评估了跨链系统的性能指标，并且分析了整个跨链网络的安全性。仿真结果与安全性分析证明，所提机制中的通道分配策略与出块权分配方案具有实际可行性，当涉及资产交易时，该机制的吞吐量最高可达到758 TPS，而不涉及资产交易时的吞吐量最高可达到960 TPS，且拥有高级别的安全性与粗细粒度兼具的隐私保护机制。基于联盟自治的区块链跨链机制可提供安全高效的跨链服务，适用于目前大多数跨链场景。

基于区块链技术的虚假新闻检测方法

龚胜佳, 张琳琳, 赵楷, 刘军涛, 杨涵

2022, 42(11): 3458-3464. DOI: 10.11772/j.issn.1001-9081.2021111885

摘要 ( )

HTML ( )

PDF (1557KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

虚假新闻不仅会导致人们形成错误观念，损害人们的知情权，还会降低新闻网站公信力。针对新闻网站出现虚假新闻的问题，提出一种基于区块链技术的虚假新闻检测方法。首先，通过调用智能合约为新闻随机分配审核者来判定新闻的真实性。然后，调整审核者数量以确保有效审核者的数量，提高审核结果的可信度。同时设计激励机制，根据审核者的行为分配奖励，并运用博弈论分析审核者的行为和获得的奖励，为了获得最大利益，审核者的行为必须是诚实的。而后设计审计机制检测恶意的审核者，以提高系统的安全性。最后，利用以太坊智能合约实现了一个简易的区块链虚假新闻检测系统，并对虚假新闻检测进行了仿真，结果显示所提方法的新闻真实性检测的准确率达到了95%，表明该方法可有效防止虚假新闻的发布。

基于区块链的电子医疗记录安全共享

林超, 何德彪, 黄欣沂

2022, 42(11): 3465-3472. DOI: 10.11772/j.issn.1001-9081.2021111895

摘要 ( )

HTML ( )

PDF (1451KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对电子医疗记录（EMR）共享面临的数据提供商集权化、患者数据管理显被动、互操作效率低、恶意传播等问题，提出一种基于区块链的电子医疗记录安全共享方法。首先，基于商用密码SM2数字签名算法提出一种更加安全高效的泛指定验证者签名证明（UDVSP）方案；然后，设计具有上传、验证、检索、撤销等功能的智能合约，构造基于区块链的电子医疗记录安全共享系统；最后，通过安全性分析和性能分析论证UDVSP方案和共享系统的可行性。安全性分析结果表明，所设计的UDVSP方案满足可证明安全性。性能评估结果表明，与现有常用的UDVSP/UDVS方案相比，节省至少87.42%的计算开销和93.75%的通信代价。区块链智能合约原型系统的仿真结果进一步论证了共享系统的安全性和高效性。

面向边缘智能计算的数据场分类算法

孙志于, 王琪, 高彬, 梁中军, 徐晓斌, 王尚广

2022, 42(11): 3473-3478. DOI: 10.11772/j.issn.1001-9081.2021091692

摘要 ( )

HTML ( )

PDF (2398KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对聚类算法研究中普遍存在不能充分利用历史信息、参数优化过程慢的问题，结合边缘智能计算提出了一种基于数据场的分布式自适应分类算法，算法部署于边缘计算（EC）节点，提供本地的智能分类服务。该算法通过引入监督信息改造传统数据场聚类模型的结构，使其能够应用于分类问题，扩展了数据场理论可应用的领域。基于数据场思想，该算法将数据的域值空间转化为数据势场空间，依据空间势值将数据分为无标签的多个类簇结果，再将类簇结果与历史监督信息进行云相似度比较，并将其归属于与其最相似的类中；同时，提出了一种基于滑动步长的参数搜索策略以提高算法参数的优化速度。在此算法基础上还提出了一种基于分布式的数据处理方案，通过云中心与边缘设备的协作，将分类任务切割分配到不同层次的节点，实现模块化、低耦合。仿真结果表明，所提算法的查准率和查全率均保持在96%以上，且汉明损失均低于0.022。实验结果表明，所提算法可以准确分类并提高参数优化速度，整体性能优于逻辑回归（LR）算法与随机森林（RF）算法。

移动边缘计算中收益最大化的缓存协作策略

王亚丽, 陈家超, 张俊娜

2022, 42(11): 3479-3485. DOI: 10.11772/j.issn.1001-9081.2022020194

摘要 ( )

HTML ( )

PDF (1553KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

移动边缘计算（MEC）通过将资源部署在用户的近邻区域，可以减少移动设备的能耗，降低用户获取服务的时延；然而，大多数有关缓存方面的研究忽略了用户所请求服务的地域差异特性。通过研究区域所请求内容的特点和内容的动态性特性，提出一种收益最大化的缓存协作策略。首先，考虑用户偏好的区域性特征，将基站分为若干协作域，使每一个区域内的基站服务偏好相同的用户；然后，根据自回归移动平均（ARIMA）模型和内容的相似度预测每个区域的内容的流行度；最后，将缓存协作问题转化为收益最大化问题，根据存放内容所获得的收益，使用贪心算法解决移动边缘环境中缓存的内容的放置和替换问题。仿真实验表明，与基于MEC分组的协作缓存算法（GHCC）相比，所提算法在缓存命中率方面提高了28%，且平均传输时延低于GHCC。可见，所提算法可以有效提高缓存命中率，减少平均传输时延。

智能计算服务的需求获取方法

汪烨, 周澳回, 周思源, 姜波, 陈骏武, 宋师哲

2022, 42(11): 3486-3492. DOI: 10.11772/j.issn.1001-9081.2022010059

摘要 ( )

HTML ( )

PDF (728KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

智能计算服务由服务提供者通过互联网为服务消费者提供数据的分析和处理，并建立学习模型完成智能计算功能。由于服务提供者与服务消费者之间缺乏有效的沟通渠道，以及服务消费者反馈的需求描述模糊、混乱，目前缺乏一种统一的服务需求获取方法对用户持续变化的需求进行有效的分析、组织和规约，导致智能计算服务无法根据用户的需求进行快速改进。针对服务开发中需求变更的持续性和不确定性等问题，提出了一种智能计算服务的需求获取方法。该方法首先从Stack Overflow问答论坛获取智能计算服务的应用反馈和问题，然后根据服务消费者所关注的需求类型采用不同的学习模型（包括支持向量机（SVM）、朴素贝叶斯和TextCNN）对其进行知识分类和优先级排序，最后采用自定义的服务需求模板统一描述智能计算服务的需求。

事件驱动的微服务调用链路数据动态采集方法

李鹏, 赵卓峰, 李寒

2022, 42(11): 3493-3499. DOI: 10.11772/j.issn.1001-9081.2021101735

摘要 ( )

HTML ( )

PDF (2643KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

微服务调用链路数据是微服务应用系统日常运行中产生的一类重要数据，它以链路形式记录了微服务应用中一次用户请求对应的一系列服务调用信息。由于系统的分布性，微服务调用链路数据产生在不同的微服务部署节点，当前对这些分布数据的采集一般采用全量采集和采样采集两种方法。全量采集会产生较大数据传输和数据存储等成本，而采样采集则可能会漏掉关键的链路数据。因此，提出一种基于事件驱动和流水线采样的微服务调用链路数据动态采集方法，并基于开源软件Zipkin设计实现了一个微服务调用链路数据动态采集系统。该系统首先对不同节点符合预定义事件特征的链路数据进行流水线采样，即数据采集服务端只在某节点产生事件定义的数据时对所有节点采集同一链路数据；同时，针对不同节点的数据产生速率不一致问题，采用基于时间窗口的多线程流式数据处理和数据同步技术实现不同节点的数据采集和传递；最后，针对各节点链路数据到达服务端先后顺序不一的问题，通过时序对齐方式进行全链路数据的同步和汇总。在公开的微服务调用链路数据集上的实验结果表明，相较于全量采集和采样采集方法，所提方法对于包含异常、慢响应等特定事件的链路数据具有采集准确性高、效率好的效果。

基于自适应多目标强化学习的服务集成方法

郭潇, 李春山, 张宇跃, 初佃辉

2022, 42(11): 3500-3505. DOI: 10.11772/j.issn.1001-9081.2021122041

摘要 ( )

HTML ( )

PDF (1403KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

当前服务互联网（IoS）中的服务资源呈现精细化、专业化的趋势，功能单一的服务无法满足用户复杂多变的需求，服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足，未考虑IoS生态系统的可持续性。针对上述问题，提出一种基于自适应多目标强化学习的服务集成方法，该方法在异步优势演员评论家（A3C）算法的框架下引入多目标优化策略，从而在满足用户需求的同时保证IoS生态系统的健康发展。所提方法可以根据遗憾值对多目标值集成权重进行动态调整，改善多目标强化学习中子目标值不平衡的现象。在真实大规模服务环境下进行了服务集成验证，实验结果表明所提方法相对于传统机器学习方法在大规模服务环境下求解速度更快；相较于权重固定的强化学习（RL），各目标的求解质量更均衡。

基于云‒端融合的个性化推荐服务系统

韩佳良, 韩宇栋, 刘譞哲, 赵耀帅, 冯迪

2022, 42(11): 3506-3512. DOI: 10.11772/j.issn.1001-9081.2021111992

摘要 ( )

HTML ( )

PDF (1160KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

主流个性化推荐服务系统通常利用部署在云端的模型进行推荐，因此需要将用户交互行为等隐私数据上传到云端，这会造成隐私泄露的隐患。为了保护用户隐私，可以在客户端处理用户敏感数据，然而，客户端存在通信瓶颈和计算资源瓶颈。针对上述挑战，设计了一个基于云?端融合的个性化推荐服务系统。该系统将传统的云端推荐模型拆分成用户表征模型和排序模型，在云端预训练用户表征模型后，将其部署到客户端，排序模型则部署到云端；同时，采用小规模的循环神经网络（RNN）抽取用户交互日志中的时序信息来训练用户表征，并通过Lasso算法对用户表征进行压缩，从而在降低云端和客户端之间的通信量以及客户端的计算开销的同时防止推荐准确率的下跌。基于RecSys Challenge 2015数据集进行了实验，结果表明，所设计系统的推荐准确率和GRU4REC模型相当，而压缩后的用户表征体积仅为压缩前的34.8%，计算开销较低。

基于社交媒体文本挖掘的个人事件检测方法

肖锐, 刘明义, 涂志莹, 王忠杰

2022, 42(11): 3513-3519. DOI: 10.11772/j.issn.1001-9081.2022010106

摘要 ( )

HTML ( )

PDF (2013KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

用户的社交媒体中蕴含着他们过去的个人经历和潜在的生活规律，研究其规律对预测用户未来的行为以及对用户进行个性化推荐有很大的价值。通过收集微博数据，定义了11种类型的事件，并提出了一个三阶段的Pipeline的系统，利用BERT预训练模型，分别在三个阶段使用BERT+BiLSTM+Attention、BERT+FullConnect、BERT+BiLSTM+CRF方法进行个人事件检测。从微博文本中抽取出该文本是否包含定义的事件、包含的事件类型、每种事件包含的元素等信息，具体元素为Subject（事件主语）、Object（事件元素）、Time（事件发生时间）、Place（事件发生的地点）和Tense（事件发生的时态），从而探究用户个人时间轴上的事件变化规律来预测个人事件。在收集的真实用户微博数据集上进行实验，并与逻辑回归、朴素贝叶斯、随机森林、决策树等分类算法进行对比分析。实验结果表明，三个阶段中的BERT+BiLSTM+Attention、BERT+FullConnect和BERT+BiLSTM+CRF方法均取得了最高的F1值，验证了所提方法的有效性。最后根据所提方法抽取出的事件和其中的时间信息可视化地构建了用户的个人事件时间轴。

基于开源社区分析的API使用案例推荐服务

张佳琪, 孙艳春, 黄罡

2022, 42(11): 3520-3526. DOI: 10.11772/j.issn.1001-9081.2021122070

摘要 ( )

HTML ( )

PDF (1339KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

目前有关API学习和代码复用的研究主要集中在对于API调用频繁模式的挖掘、组件化信息的提取以及根据用户的需求和目标功能进行的个性化应用程序接口（API）推荐服务等方面。然而，作为缺少专业知识和经验技能来完成特定使用案例的软件开发初学者，在阅读官方文档之外，往往需要真实的使用案例作为参考。现有代码推荐研究大多为单片段式代码，缺少跨函数的案例选择，这不利于初学者学习构建完整的使用场景或功能模块；同时，从单个函数注释中提取的语义描述也不足以构建学习者对项目中完整功能实现方法的认识。为了解决上述问题，提出了一种基于开源社区分析的API使用案例推荐服务，并以软件开发后端框架Spring Boot为例，构建了跨函数的案例推荐辅助学习服务。随后，通过调查问卷、专家验证等方式验证了所提出的API使用案例推荐服务的可行性和有效性。

基于客服对话的产品和服务质量分析

张家菊, 林慧苹

2022, 42(11): 3527-3533. DOI: 10.11772/j.issn.1001-9081.2022010073

摘要 ( )

HTML ( )

PDF (2371KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的产品和服务质量分析常通过问卷调查或利用商品评论，但存在问卷收集难度大、商品评论中存在无效数据等问题。客服对话作为顾客与商家之间沟通的桥梁，包含了丰富的顾客意见，覆盖了从产品到服务的多个方面，然而现在利用客服对话分析产品和服务质量的研究还较少。提出了一种基于客服对话的产品和服务质量分析方法，首先结合产品特征和服务蓝图，确定产品和服务质量的评价要素，并结合重要性?满意度分析（IPA）法定义评价要素的重要性和满意度指标；然后对客服对话进行主题提取和情感分析，定量分析产品和服务的重要性和满意度。以某消毒除菌产品淘宝旗舰店的真实客服对话为例应用了该方法，建立了18个评价要素，并基于90余万条真实的历史客服对话对评价要素的重要性和满意度进行了量化，从而分析旗舰店产品和服务的质量。最后通过对专业客服的问卷调研，验证了所提方法的有效性。

用于虚拟现实系统的眼动交互技术综述

侯守明, 贾超兰, 张明敏

2022, 42(11): 3534-3543. DOI: 10.11772/j.issn.1001-9081.2021122134

摘要 ( )

HTML ( )

PDF (1617KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

眼动人机交互利用眼动特点可以增强用户的沉浸感和提高舒适度，在虚拟现实（VR）系统中融入眼动交互技术对VR系统的普及起到至关重要的作用，已成为近年来的研究热点。对VR眼动交互技术的原理和类别进行阐述，分析了将VR系统与眼动交互技术结合的优势，归纳了目前市面上主流VR头显设备及典型的应用场景。在对有关VR眼动追踪相关实验分析的基础上，总结了VR眼动的研究热点问题，包括微型化设备、屈光度矫正、优质内容的匮乏、晕屏与眼球图像失真、定位精度、近眼显示系统，并针对相关的热点问题展望相应的解决方案。

虚拟现实大空间下多虚拟目标被动触觉交互方法

王杰科, 李琳, 张海龙, 郑利平

2022, 42(11): 3544-3550. DOI: 10.11772/j.issn.1001-9081.2021122123

摘要 ( )

HTML ( )

PDF (2818KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对虚拟现实（VR）大空间下为重定向行走的用户提供被动触觉时存在的虚实交互目标无法一一对应的问题，提出了一种用两个物理代理作为触觉代理为多个虚拟目标提供触觉反馈的方法，以在基于人工势场（APF）的重定向行走过程中，交替地满足用户被动触觉的需求。针对重定向行走算法本身以及标定不精确等原因造成的虚实不对齐的问题，对虚拟目标的位置及朝向进行设计并且在交互阶段引入触觉重定向。仿真实验表明对虚拟目标位置和朝向的设计可以大幅降低对齐误差；而用户实验结果证明触觉重定向的引入进一步提升了交互准确性，且能为用户带来更丰富、更具沉浸感的体验。

3D场景渲染的视觉显著性驱动间接光照复用算法

齐淑杰, 陈纯毅, 胡小娟, 于海洋

2022, 42(11): 3551-3557. DOI: 10.11772/j.issn.1001-9081.2021122181

摘要 ( )

HTML ( )

PDF (2946KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为提高路径追踪渲染3D场景的速度，提出3D场景渲染的视觉显著性驱动间接光照复用算法。首先，根据视觉感知中感兴趣区域显著性高、其他区域显著性低的特点得到场景画面的2D显著性图，该显著性图由图像的颜色信息、边缘信息、深度信息以及运动信息构成。然后，重新渲染高显著性区域的间接光照，而低显著性区域则在满足一定条件的情况下复用上一帧的间接光照，达到加速渲染的目的。实验结果表明：该算法生成画面的全局光照效果真实，在多个实验场景下的渲染速度均有提升，速度最高能达到高质量渲染的5.89倍。

融合优化特征提取结构的目标检测算法

向南, 潘传忠, 虞高翔

2022, 42(11): 3558-3563. DOI: 10.11772/j.issn.1001-9081.2021122122

摘要 ( )

HTML ( )

PDF (1607KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对DETR对小目标的检测精度低的问题，基于DETR提出一种优化特征提取结构的目标检测算法——CF?DETR。首先通过结合了优化跨阶段部分（CSP）网络的CSP?Darknet53对原始图进行特征提取并输出4种尺度的特征图；其次利用特征金字塔网络（FPN）对4种尺度特征图进行下采样和上采样后进行拼接融合，并输出52×52尺寸的特征图；最后将该特征图与位置编码信息结合输入Transformer后得到特征序列，输入到作为预测头的前向反馈网络后输出预测目标的类别与位置信息。在COCO2017数据集上，与DETR相比，CF?DETR的模型的超参数量减少了2×10⁶，在小目标上的平均检测精度提高2.1个百分点，在中、大尺寸目标上的平均检测精度提高了2.3个百分点。实验结果表明，优化特征提取结构能够在降低模型超参数量的同时有效提高DETR的检测精度。

基于时间注意力机制和EfficientNet的视频暴力行为检测

蔡兴泉, 封丁惟, 王通, 孙辰, 孙海燕

2022, 42(11): 3564-3572. DOI: 10.11772/j.issn.1001-9081.2021122153

摘要 ( )

HTML ( )

PDF (2885KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对一般的暴力行为检测方法模型参数量大、计算复杂度高、准确率较低等问题，提出一种基于时间注意力机制和EfficientNet的视频暴力行为检测方法。首先将通过对数据集进行预处理计算得到的前景图输入到网络模型中提取视频特征，同时利用轻量化EfficientNet提取前景图中的帧级空间暴力特征，并利用卷积长短时记忆网络（ConvLSTM）进一步提取视频序列的全局时空特征；接着，结合时间注意力机制，计算得到视频级特征表示；最后将视频级特征表示映射到分类空间，并利用Softmax分类器进行视频暴力行为分类并输出检测结果，实现视频的暴力行为检测。实验结果表明，该方法能够减少模型参数量，降低计算复杂度，在有限的资源下提高暴力行为检测准确率，提升模型的综合性能。

基于多粒度特征生成对抗网络的跨分辨率行人重识别

耿艳兵, 廉永健

2022, 42(11): 3573-3579. DOI: 10.11772/j.issn.1001-9081.2021122124

摘要 ( )

HTML ( )

PDF (2598KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有基于生成对抗网络（GAN）的超分辨率（SR）重建方法用于跨分辨率行人重识别（ReID）时，重建图像在纹理结构内容的恢复和特征一致性保持方面均存在不足。针对上述问题，提出基于多粒度信息生成网络的跨分辨率行人ReID方法。首先，在生成器的多层网络上均引入自注意力机制，聚焦多粒度稳定的结构关联区域，重点恢复低分辨率（LR）行人图像的纹理结构信息；同时，在生成器后增加一个识别器，在训练过程中最小化生成图像与真实图像在不同粒度特征上的损失，提升生成图像与真实图像在特征上的一致性。然后，联合自注意力生成器和识别器，与判别器交替优化，在内容和特征上改进生成图像。最后，联合改进的GAN和行人ReID网络交替训练优化网络的模型参数，直至模型收敛。在多个跨分辨率行人数据集上的实验结果表明，所提算法的累计匹配曲线（CMC）在其首选识别率（rank?1）上的准确率较现有同类算法平均提升10个百分点，在提升SR图像内容一致性和特征表达一致性方面均表现更优。

基于注意力模型和轻量化YOLOv4的林业害虫检测方法

孙海燕, 陈云博, 封丁惟, 王通, 蔡兴泉

2022, 42(11): 3580-3587. DOI: 10.11772/j.issn.1001-9081.2021122164

摘要 ( )

HTML ( )

PDF (4972KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对当前林业害虫检测方法检测速度慢、准确率较低和存在漏检误检等问题，提出一种基于注意力模型和轻量化YOLOv4的林业害虫检测方法。首先构建数据集，使用几何变换、随机色彩抖动和Mosaic数据增强技术对数据集进行预处理；其次将YOLOv4的主干网络替换为轻量化网络MobileNetV3，并在改进后的路径聚合网络（PANet）中添加卷积块注意力模块（CBAM），搭建改进的轻量化YOLOv4网络模型；然后引入Focal Loss优化YOLOv4网络模型的损失函数；最后将预处理后的数据集输入到改进后的网络模型中，输出包含害虫种类和位置信息的检测结果。实验结果表明，该网络的各项改进点对模型的性能提升都有效；相较于原YOLOv4模型，新模型的检测速度更快，平均精度均值（mAP）更高，并且能有效解决漏检和误检问题。新模型优于目前的主流网络模型，能满足林业害虫实时检测的精度和速度要求。

深度学习可解释性研究综述

雷霞, 罗雄麟

2022, 42(11): 3588-3602. DOI: 10.11772/j.issn.1001-9081.2021122118

摘要 ( )

HTML ( )

PDF (1703KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着深度学习的广泛应用，人类越来越依赖于大量采用深度学习技术的复杂系统，然而，深度学习模型的黑盒特性对其在关键任务应用中的使用提出了挑战，引发了道德和法律方面的担忧，因此，使深度学习模型具有可解释性是使它们令人信服首先要解决的问题。于是，关于可解释的人工智能领域的研究应运而生，主要集中于向人类观察者明确解释模型的决策或行为。对深度学习可解释性的研究现状进行综述，为进一步深入研究建立更高效且具有可解释性的深度学习模型确立良好的基础。首先，对深度学习可解释性进行了概述，阐明可解释性研究的需求和定义；然后，从解释深度学习模型的逻辑规则、决策归因和内部结构表示这三个方面出发介绍了几种可解释性研究的典型模型和算法，另外还指出了三种常见的内置可解释模型的构建方法；最后，简单介绍了忠实度、准确性、鲁棒性和可理解性这四种评价指标，并讨论了深度学习可解释性未来可能的发展方向。

基于迁移学习的文本共情预测

李晨光, 张波, 赵骞, 陈小平, 王行甫

2022, 42(11): 3603-3609. DOI: 10.11772/j.issn.1001-9081.2021091632

摘要 ( )

HTML ( )

PDF (777KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

由于缺乏足够的训练数据，文本共情预测的进展一直都较为缓慢；而与之相关的文本情感极性分类任务则存在大量有标签的训练样本。由于文本共情预测与文本情感极性分类两个任务间存在较大相关性，因此提出了一种基于迁移学习的文本共情预测方法，该方法可从情感极性分类任务中学习到可迁移的公共特征，并通过学习到的公共特征辅助文本共情预测任务。首先通过一个注意力机制对两个任务间的公私有特征进行动态加权融合；其次为了消除两个任务间的数据集领域差异，通过一种对抗学习策略来区分两个任务间的领域独有特征与领域公共特征；最后提出了一种Hinge?loss约束策略，使共同特征对不同的目标标签具有通用性，而私有特征对不同的目标标签具有独有性。在两个基准数据集上的实验结果表明，相较于对比的迁移学习方法，所提方法的皮尔逊相关系数（PCC）和决定系数（R²）更高，均方误差（MSE）更小，充分说明了所提方法的有效性。

基于图模型和注意力模型的会话推荐方法

党伟超, 姚志宇, 白尚旺, 高改梅, 刘春霞

2022, 42(11): 3610-3616. DOI: 10.11772/j.issn.1001-9081.2021091696

摘要 ( )

HTML ( )

PDF (1175KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为解决基于循环神经网络（RNN）会话推荐方法的兴趣偏好表示不全面、不准确问题，提出基于图模型和注意力模型的会话推荐（SR?GM?AM）方法。首先，图模型利用全局图和会话图分别获取邻域信息和会话信息，并且利用图神经网络（GNN）提取项目图特征，项目图特征经过全局项目表示层和会话项目表示层得到全局级嵌入和会话级嵌入，两种级别嵌入结合生成图嵌入；然后，注意力模型使用软注意力进行图嵌入和反向位置嵌入融合，目标注意力激活目标项目相关性，注意力模型通过线性转换生成会话嵌入；最后，SR?GM?AM经过预测层，输出下次点击的N项推荐列表。在两个真实的公共电子商务数据集Yoochoose和Diginetica上对比了SR?GM?AM方法与基于无损边缘保留聚合和快捷图注意力的推荐（LESSR）方法，结果显示，SR?GM?AM方法的P@20最高达到了72.41%，MRR@20最高达到了35.34%，验证了SR?GM?AM的有效性。

基于负边距损失的小样本目标检测

杜芸彦, 李鸿, 杨锦辉, 江彧, 毛耀

2022, 42(11): 3617-3624. DOI: 10.11772/j.issn.1001-9081.2021091683

摘要 ( )

HTML ( )

PDF (1509KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的大部分目标检测算法都依赖于大规模的标注数据集来保证检测的正确率，但某些场景往往很难获得大量标注数据，且耗费大量人力、物力。针对这一问题，提出了基于负边距损失的小样本目标检测方法（NM?FSTD），将小样本学习（FSL）中属于度量学习的负边距损失方法引入目标检测，负边距损失可以避免将同一新类的样本错误地映射到多个峰值或簇，有助于小样本目标检测中新类的分类。首先采用大量训练样本和基于负边距损失的目标检测框架训练得到具有良好泛化性能的模型，之后通过少量具有标签的目标类别的样本对模型进行微调，并采用微调后的模型对目标类别的新样本进行目标检测。为了验证NM?FSTD的检测效果，使用MS COCO进行训练和评估。实验结果表明，所提方法AP₅₀达到了22.8%，与Meta R?CNN和MPSR相比，准确率分别提高了3.7和4.9个百分点。NM?FSTD能有效提高在小样本情况下对目标类别的检测性能，解决目前目标检测领域中数据不足的问题。

基于数据增强的运动想象脑电分类

彭禹, 宋耀莲, 杨俊

2022, 42(11): 3625-3632. DOI: 10.11772/j.issn.1001-9081.2021091701

摘要 ( )

HTML ( )

PDF (3924KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对运动想象脑电（MI?EEG）多分类问题，在已有研究的基础上进行改进，构建了基于深度可分离卷积的轻量级卷积神经网络（L?Net）和轻量级混合网络（LH?Net），并在BCI竞赛Ⅳ-2a四分类数据集上进行了实验和分析，结果表明：L?Net比LH?Net可以更快地拟合数据，训练时间更短；但LH?Net的稳定性比L?Net更好，在测试集上的分类性能具有更好的稳健性，平均准确率和平均Kappa系数比L?Net分别提高了3.6个百分点和4.8个百分点。为了进一步提升模型分类性能，采用了基于时频域的高斯噪声添加新方法对训练样本进行数据增强（DA），并针对噪声的强度进行了仿真验证，推测出了两种模型的最优噪声强度的取值范围。仿真结果表明使用了该数据增强方法后，两种模型的平均准确率最少提高了4个百分点，四分类效果均得到了明显提升。

基于直方图平移的视频密文域大容量可逆信息隐藏

陈培, 张帅伟, 林洋平, 钮可, 杨晓元

2022, 42(11): 3633-3638. DOI: 10.11772/j.issn.1001-9081.2021101722

摘要 ( )

HTML ( )

PDF (1692KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对视频密文域可逆信息隐藏（RDH）嵌入容量不高的问题，提出一种基于直方图平移的视频密文域大容量可逆信息隐藏方案。首先，利用流密码算法对4×4亮度帧内预测模式和运动矢量差值（MVD）的符号位进行加密，形成视频密文域；其次，构造MVD的二维直方图，设计关于（0，0）对称的直方图平移算法；最后，在MVD密文域中进行直方图平移，实现可分离的视频密文域可逆信息隐藏。实验结果表明，与对比方案相比，所提方案的嵌入容量平均提升263.3%，加密视频的平均峰值信噪比（PSNR）最高不超过15.956 dB，含密的解密视频的平均PSNR均能达到30 dB以上。所提方案可以有效提升嵌入容量，适用于更多类型的视频序列。

当期目录