当期目录

    2024年 第44卷 第8期 刊出日期:2024-08-10 封面下载 目录下载
    人工智能
    基于双流神经网络的个性化联邦学习方法
    沈哲远, 杨珂珂, 李京
    2024, 44(8):  2319-2325.  DOI: 10.11772/j.issn.1001-9081.2023081207
    摘要 ( )   HTML ( )   PDF (2185KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    经典的联邦学习(FL)算法在数据高度异构的场景下难以取得较好的效果。个性化联邦学习(PFL)针对数据异构问题,提出新的解决方案,即为每个客户端“量身定做”专属模型,这样模型会拥有较好的性能;然而同时会引出难以将FL扩展到新客户端上的问题。针对PFL中的性能与扩展的难题展开研究,提出基于双流神经网络结构的联邦学习模型,简称FedDual。双流神经网络模型通过增加一个用于分析客户端个性化特征的编码器,既能拥有个性化模型的性能,又便于扩展到新客户端。实验结果表明,相较于经典联邦平均(FedAvg)算法,FedDual在MNIST和FashionMNIST等数据集上的准确率有明显提升,而在CIFAR10数据集上的准确率提升了10个百分点以上,且面对新客户端保持准确率不下降,实现了“即插即用”,解决了新客户端难以扩展的问题。

    课程学习指导下的半监督目标检测框架
    张英俊, 李牛牛, 谢斌红, 张睿, 陆望东
    2024, 44(8):  2326-2333.  DOI: 10.11772/j.issn.1001-9081.2023081062
    摘要 ( )   HTML ( )   PDF (2042KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了提高伪标签的质量,解决半监督目标检测(SSOD)中的确认偏差问题,并针对现有算法中忽视无标注数据复杂性导致错误伪标签的难点,提出一种课程学习(CL)指导下的SSOD框架,该框架主要由ICSD(IoU-Confidence-Standard-Deviation)难度测量器和BP(Batch-Package)训练调度器这2个模块组成。其中,ICSD难度测量器综合考虑了伪边界框之间的交并比(IoU)、置信度、类别标签等信息,并引入C_IOU(Checkpoint_IOU)方法评估无标注数据的可靠性;BP训练调度器设计2种高效调度策略,分别从Batch和Package角度出发,优先选择可靠性指标高的无标记数据,实现以CL的方式充分利用整个无标记数据集。在Pascal VOC和MS-COCO数据集上的广泛对比实验结果表明,所提框架不仅适用于现有的SSOD算法,而且检测精度和稳定性都得到显著提升。

    基于裁剪优化和策略指导的近端策略优化算法
    周毅, 高华, 田永谌
    2024, 44(8):  2334-2341.  DOI: 10.11772/j.issn.1001-9081.2023081079
    摘要 ( )   HTML ( )   PDF (3877KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对近端策略优化(PPO)算法难以严格约束新旧策略的差异和探索与利用效率较低这2个问题,提出一种基于裁剪优化和策略指导的PPO(COAPG-PPO)算法。首先,通过分析PPO的裁剪机制,设计基于Wasserstein距离的信任域裁剪方案,加强对新旧策略差异的约束;其次,在策略更新过程中,融入模拟退火和贪心算法的思想,提升算法的探索效率和学习速度。为了验证所提算法的有效性,使用MuJoCo测试基准对COAPG-PPO与CO-PPO(PPO based on Clipping Optimization)、PPO-CMA(PPO with Covariance Matrix Adaptation)、TR-PPO-RB(Trust Region-based PPO with RollBack)和PPO算法进行对比实验。实验结果表明,COAPG-PPO算法在大多数环境中具有更严格的约束能力、更高的探索和利用效率,以及更高的奖励值。

    融合评论序列二义性与生成用户隐私特征的谣言检测
    孟文凡, 周丽华, 王晓旭
    2024, 44(8):  2342-2350.  DOI: 10.11772/j.issn.1001-9081.2023081176
    摘要 ( )   HTML ( )   PDF (3676KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有谣言检测工作存在以下问题:1)没有同时捕获评论序列的文本语义特征和时间周期特征;2)在隐私保护环境下无法获取用户个人资料,导致传播结构中的信息难以充分融合。为此,提出融合评论序列二义性与生成用户隐私特征的谣言检测模型(RD-CSGU)。综合考虑了评论序列不同视角下的文本语义特征和时间周期特征,同时构建了反映传播过程中用户之间社交互动关系的谣言传播异质网络,并基于该网络中的语义关系通过生成对抗网络(GAN)生成用户的隐私特征,解决了用户个人资料访问受限的问题。在Twitter15、Twitter16、Weibo数据集上展开有效性验证,与次优基线模型GLAN(Global-Local Attention Network)相比,RD-CSGU的准确率(Acc)分别提升了0.9、2.2和1.8个百分点,真谣言F1(TR-F1)值分别提升了2.6、6.8和1.9个百分点;结合消融实验及GAN生成嵌入分析的实验结果表明,RD-CSGU能有效检测出社交媒体平台上发布的谣言帖子。

    基于认知诊断的个性化习题推荐
    韩祎珂, 徐彬, 张硕
    2024, 44(8):  2351-2356.  DOI: 10.11772/j.issn.1001-9081.2023081205
    摘要 ( )   HTML ( )   PDF (1652KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的基于认知诊断的习题推荐建模角度单一以及习题推荐结果不够合理的问题,提出结合认知诊断和深度因子分解机的个性化习题推荐方法。首先,设计一种知识点关系计算方法构建课程知识树,并提出增强Q矩阵准确表示习题所含知识点的关系的概念;其次,提出基于知识点关系和习题表征的认知诊断(NeuralCD-KD)模型,该模型计算增强Q矩阵,利用特征二阶交叉和注意力机制融合习题难度的内外因素,并模拟学生的认知状态。在私有数据集和公开数据集上验证了提出的认知诊断模型的有效性,并且该方法能对学生的认知状态做出合理解释。为了个性化习题推荐,结合诊断模型和深度双线性因子分解机,提出结合认知诊断和深度因子分解机(NKD-DBFM)方法,在私有数据集上验证了所提习题推荐方法的有效性,在曲线下面积(AUC)上相较于最优基线模型神经认知诊断模型(NeuralCDM)提升了3.7个百分点。

    基于图共现增强多层感知机的会话推荐
    唐廷杰, 黄佳进, 秦进, 陆辉
    2024, 44(8):  2357-2364.  DOI: 10.11772/j.issn.1001-9081.2023081063
    摘要 ( )   HTML ( )   PDF (1743KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对多层感知机(MLP)架构无法捕获会话序列上下文中的共现关系的问题,提出了一种基于图共现增强MLP的会话推荐模型GCE-MLP。首先,利用MLP架构捕获会话序列的顺序依赖关系,同时通过共现关系学习层获得序列上下文中的共现关系,并通过信息融合模块得到会话表示;其次,设计了特定的特征选择层,旨在扩大不同关系学习层输入特征的差异性;最后,通过噪声对比任务最大化两种关系表征之间的互信息,进一步增强对会话兴趣的表征学习。在多个真实数据集上的实验结果表明GCE-MLP的推荐性能优于目前主流的模型,验证了该模型的有效性。与最优的MLP架构模型FMLP-Rec(Filter-enhanced MLP for Recommendation)相比,在Diginetica数据集上,P@20最高达到了54.08%,MRR@20最高达到了18.87%,分别提升了2.14和1.43个百分点;在Yoochoose数据集上,P@20最高达到了71.77%,MRR@20最高达到了31.78%,分别提升了0.48和1.77个百分点。

    基于两阶段动态兴趣识别的购买行为预测模型
    张春雪, 仇丽青, 孙承爱, 荆彩霞
    2024, 44(8):  2365-2371.  DOI: 10.11772/j.issn.1001-9081.2023081201
    摘要 ( )   HTML ( )   PDF (1474KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在线购买预测旨在预测用户的购买行为,为购物网站带来可观的商业价值。针对传统模型学习用户历史行为中隐含的兴趣偏好不准确的问题,提出基于两阶段动态兴趣识别的购买行为预测模型,以预测用户购买商品的概率。首先,模型的第一阶段构建用户-商品的点击频率图,并利用轻量图卷积网络(LightGCN)学习图的上下文特征作为用户的静态兴趣表征;其次,第二阶段采用带有注意力机制的双向门控递归单元(Bi-GRU)探索用户偏好的转化过程;最后,针对潜在的高维特征,建立一个融合动态兴趣和隐含特征的购买预测模型。在2个真实电子商务数据集上的实验结果表明,所提模型与图卷积网络(GCN)模型相比,准确率至少提升0.3个百分点,F1分数至少提升了2.05个百分点。

    改进的CloFormer模型与有序回归相结合的年龄评估方法
    付帅, 郭小英, 白茹意, 闫涛, 陈斌
    2024, 44(8):  2372-2380.  DOI: 10.11772/j.issn.1001-9081.2023081199
    摘要 ( )   HTML ( )   PDF (3667KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的年龄评估方法通常采用基于卷积神经网络(CNN)的有序回归,然而在预测相邻年龄时,CNN难以捕获全局特征表示,进而导致预测精度的下降。为了解决该问题,提出一种新的将改进的CloFormer模型与有序回归相结合的年龄评估方法。相较于传统的基于CNN的有序回归,CloFormer在捕捉图像特征时能够利用自注意力机制更好地捕捉图像中不同区域之间的关系,从而更好地学习相邻年龄之间的特征差异。首先,优化CloFormer模型;然后,将优化后的CloFormer模型与有序回归相结合,以便更好地利用年龄序列信息,实现更精准的年龄预测;接着,通过端到端优化训练改进后的CloFormer模型和有序回归模型,更好地学习面部特征和年龄序列的关系;最后,在多个公开数据集上对比实验。实验结果表明,所提方法在CACD、AFAD、UTKFace数据集上的均方根误差(RMSE)分别为7.36、4.62、8.28,与基于CNN的有序回归(OR-CNN)、秩一致性有序回归模型(CORAL)等现有年龄评估方法相比,在CACD数据集上分别减小了0.25、0.05,在AFAD数据集上分别减小了0.18、0.03,在UTKFace数据集上分别减小了0.97、0.53,可见所提方法取得了较好的年龄评估结果。

    一致性保留的集成排序年龄估计方法
    孙淳, 胡春龙, 黄树成
    2024, 44(8):  2381-2386.  DOI: 10.11772/j.issn.1001-9081.2023081173
    摘要 ( )   HTML ( )   PDF (2290KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在基于传统的排序、回归的年龄估计方法中,存在不能有效利用人脸的演化特征、构建不同排序标签之间的相关性,且二分类方法进行年龄估计会产生排序不一致的问题。基于上述问题,提出一致性保留的集成排序年龄估计方法,充分利用年龄与排序值之间的相关性,抑制排序不一致问题;并提出新指标——排序不一致样本比例,用于评估二分类排序方法中排序不一致问题。首先,通过设计的编码方法将年龄类别转换成排序矩阵形式;然后,使用残差网络ResNet34(Residual Network)特征提取网络提取面部特征,再通过提出的编码学习模块进行编码学习;最后,通过基于度量方法的排序解码器将网络预测结果解码成图片的预测年龄。在MORPH Ⅱ数据集上的实验结果达到平均绝对误差(MAE)2.18,并在其他公开数据集上与同样基于排序、有序回归方法的OR-CNN(Ordinal Regression with CNN)、CORAL(COnsistent RAnk Logits)等方法相比,所提方法有更准确的预测结果,同时抑制了排序不一致样本的比例,排序不一致度量性能比OR-CNN方法提升了约65%。

    融合自监督和多层交叉注意力的多模态情感分析网络
    薛凯鹏, 徐涛, 廖春节
    2024, 44(8):  2387-2392.  DOI: 10.11772/j.issn.1001-9081.2023081209
    摘要 ( )   HTML ( )   PDF (1572KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对多模态情感分析任务中模态内信息不完整、模态间交互能力差和难以训练的问题,将视觉语言预训练(VLP)模型应用于多模态情感分析领域,提出一种融合自监督和多层交叉注意力的多模态情感分析网络(MSSM)。通过自监督学习强化视觉编码器模块,并加入多层交叉注意力以更好地建模文本和视觉特征,使模态内部信息更丰富完整,同时使模态间的信息交互更充分。此外,通过具有感知意识的快速、内存效率高的精确注意力FlashAttention解决Transformer中注意力计算高复杂度的问题。实验结果表明,与目前主流的基于对比文本-图像对的模型(CLIP)相比,MSSM在处理后的MVSA-S数据集上的准确率提高3.6个百分点,在MVSA-M数据集上的准确率提高2.2个百分点,验证所提网络能在降低运算成本的同时有效提高多模态信息融合的完整性。

    基于交互注意力机制的心理咨询文本情感分类模型
    汪雨晴, 朱广丽, 段文杰, 李书羽, 周若彤
    2024, 44(8):  2393-2399.  DOI: 10.11772/j.issn.1001-9081.2023081168
    摘要 ( )   HTML ( )   PDF (1474KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    心理咨询场景下的情感分类旨在获得咨询者话语的情感倾向,为建立心理咨询AI助手提供支持。现有的方法利用语境信息获取文本情感倾向,但未考虑对话记录中当前句与前向近邻句之间的情感传递。针对这一问题,提出一种基于交互注意力(AOA)机制的心理咨询文本情感分类模型,根据时序对历史情感词分配权重,进而提高分类准确率。利用构建的心理健康情感词典分别提取对话双方的历史情感词序列,再将当前句和历史情感词序列输入到双向长短期记忆(BiLSTM)网络获取对应的特征向量,并利用艾宾浩斯遗忘曲线对历史情感词序列分配权重。通过AOA机制获得惯性特征和交互特征,并结合文本特征输入到分类层计算情感倾向概率。在公开数据集Emotional First Aid Dataset上的实验结果表明,相较于Caps-DGCN(Capsule network and Directional Graph Convolutional Network)模型,所提模型的F1值提高了1.55%。可见,所提模型可以有效提升心理咨询文本的情感分类效果。

    融合坐标与多头注意力机制的交互语音情感识别
    高鹏淇, 黄鹤鸣, 樊永红
    2024, 44(8):  2400-2406.  DOI: 10.11772/j.issn.1001-9081.2023081160
    摘要 ( )   HTML ( )   PDF (2819KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    语音情感识别(SER)是人机交互系统中一项重要且充满挑战性的任务。针对目前SER系统中存在特征单一和特征间交互性较弱的问题,提出多输入交互注意力网络MIAN。该网络由特定特征坐标残差注意力网络和共享特征多头注意力网络两个子网络组成。前者利用Res2Net和坐标注意力模块学习从原始语音中获取的特定特征,并生成多尺度特征表示,增强模型对情感相关信息的表征能力;后者融合前向网络所获取的特征,组成共享特征,并经双向长短时记忆(BiLSTM)网络输入至多头注意力模块,能同时关注不同特征子空间中的相关信息,增强特征之间的交互性,以捕获判别性强的特征。通过2个子网络间的协同作用,能增加模型特征的多样性,增强特征之间的交互能力。在训练过程中,应用双损失函数共同监督,使同类样本更紧凑、不同类样本更分离。实验结果表明,MIAN在EMO-DB和IEMOCAP语料库上分别取得了91.43%和76.33%的加权平均精度,相较于其他主流模型,具有更好的分类性能。

    基于多尺度频率通道注意力融合的声纹库构建方法
    陈彤, 杨丰玉, 熊宇, 严荭, 邱福星
    2024, 44(8):  2407-2413.  DOI: 10.11772/j.issn.1001-9081.2023081276
    摘要 ( )   HTML ( )   PDF (2240KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Network)的基础上作了3点改进,包括:加入了多尺度频率通道注意力前端以从话语中获得高分辨率的特征表示、添加了多尺度通道注意力模块结合局部和全局的特征以融合多尺度信息、嵌入了特征注意力融合模块为多尺度的融合特征加权。这些改进使模型更好地利用多尺度的时频信息,提高识别能力。实验结果表明,与ECAPA-TDNN模型相比,MFCA-TDNN模型等错误率(EER)和最小检测代价函数(minDCF)分别下降5.9%和7.9%;最低的EER可达到3.83%,最低的minDCF可达到0.220 2。

    基于扩散序列的多元可控文本生成
    李晨阳, 张龙, 郑秋生, 钱少华
    2024, 44(8):  2414-2420.  DOI: 10.11772/j.issn.1001-9081.2023081137
    摘要 ( )   HTML ( )   PDF (1267KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    随着大规模预训练语言模型的出现,文本生成技术已取得突破性进展。然而,在开放性文本生成领域,生成的内容缺乏拟人化的情感特征,使生成的文本难以让人产生共鸣和情感上的联系,可控文本生成在弥补当前文本生成技术不足方面具有重要意义。首先,在ChnSentiCorp数据集的基础上完成主题和情感属性的扩展,同时,为构建一个可生成流畅文本且情感丰富的多元可控文本生成模型,提出一种基于扩散序列的可控文本生成模型DiffuSeq-PT。该模型以扩散模型为基础架构,利用主题情感属性和文本数据在无分类器引导条件下对序列执行扩散过程,使用预训练模型ERNIE 3.0(Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generation)的编码解码能力贴合扩散模型的加噪去噪过程,最终生成符合相关主题和多情感粒度的目标文本。与基准模型DiffuSeq相比,所提模型在2个公开的真实数据集(ChnSentiCorp和辩论数据集)上分别取得0.13和0.01的BERTScore值的提升,困惑度分别下降了14.318和9.46。

    基于改进分段卷积神经网络和知识蒸馏的学科知识实体间关系抽取
    赵宇博, 张丽萍, 闫盛, 侯敏, 高茂
    2024, 44(8):  2421-2429.  DOI: 10.11772/j.issn.1001-9081.2023081065
    摘要 ( )   HTML ( )   PDF (2292KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    关系抽取是梳理学科知识的重要手段以及构建教育知识图谱的重要步骤。在当前研究中,如BERT(Bidirectional Encoder Representations from Transformers)等以Transformer架构为基础的预训练语言模型多数存在参数量大、复杂度过高的问题,难以部署于终端设备,限制了在真实教育场景中的应用。此外,大多数传统的轻量级关系抽取模型并不是通过文本结构对数据进行建模,容易忽略实体间的结构信息;且生成的词嵌入向量难以捕捉文本的上下文特征、对一词多义问题解决能力差,难以契合学科知识文本非结构化以及专有名词占比大的特点,不利于高质量的关系抽取。针对上述问题,提出一种基于改进分段卷积神经网络(PCNN)和知识蒸馏(KD)的学科知识实体间关系抽取方法。首先,利用BERT生成高质量的领域文本词向量,改进PCNN模型的输入层,从而有效捕捉文本上下文特征并在一定程度上解决一词多义问题;其次,利用卷积和分段最大池化操作深入挖掘实体间结构信息,构建BERT-PCNN模型,实现高质量的关系抽取;最后,考虑到教育场景对高效且轻量化模型的需求,蒸馏BERT-PCNN模型输出层和中间层知识,用于指导PCNN模型,完成KD-PCNN模型的构建。实验结果表明,BERT-PCNN模型的加权平均F1值达到94%,相较于R-BERT和EC_BERT模型分别提升了1和2个百分点;KD-PCNN模型的加权平均F1值达到92%,与EC_BERT模型持平;参数量相较于BERT-PCNN、KD-RB-l模型下降了3个数量级。可见,所提方法能在性能评价指标和网络参数量之间更好地权衡,有利于教育知识图谱自动化构建水平的提高和新型教育应用的研发与部署。

    基于语境增强的新能源汽车投诉文本方面-观点对抽取
    汪才钦, 周渝皓, 张顺香, 王琰慧, 王小龙
    2024, 44(8):  2430-2436.  DOI: 10.11772/j.issn.1001-9081.2023081167
    摘要 ( )   HTML ( )   PDF (1921KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    挖掘新能源汽车投诉文本中用户对产品多维度的意见,能为产品的设计决策提供参考。因投诉文本具有实体密度高、句式冗长等特点,导致当前方面-观点对抽取(AOPE)方法感知方面项与观点项间的关联性不强。针对这一问题,提出一种基于语境增强的AOPE模型(AOE-CE),通过融合主题特征与文本特征作为语境表示增强实体间的关联关系。模型由实体识别和关系检测2个模块组成:首先,实体识别通过预训练模型和词性标注工具编码文本,再利用双向长短期记忆(Bi-LSTM)网络结合多头注意力捕获上下文信息得到文本特征,并将文本特征输入至条件随机场(CRF)得到实体集合;关系检测通过BERT(Bidirectional Encoder Representations from Transformers)获取主题特征,并将主题特征与文本特征融合获得增强的语境表示,再利用三仿射机制以语境表示为辅助增强实体间的关联关系,最后通过Sigmoid得到抽取结果。实验结果表明,AOE-CE的精准率、召回率和F1值比SDRN(Synchronous Double-channel Recurrent Network)模型分别提升了2.19、1.08和1.60个百分点,表明所提模型具有更好的AOPE效果。

    社交媒体数据中水灾事件求助信息提取模型
    孙焕良, 王思懿, 刘俊岭, 许景科
    2024, 44(8):  2437-2445.  DOI: 10.11772/j.issn.1001-9081.2023081080
    摘要 ( )   HTML ( )   PDF (2708KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    由于社交媒体平台上所发布的非结构化信息存在数据不一致、重要程度不同等问题,使自动准确抽取所需信息并标注受灾级别成为一个有挑战性的工作。因此,结合形式概念分析(FCA)、词共现关系和上下文语义信息构建了水灾事件知识体系。利用所构建的知识体系,基于TencentPretrain框架对大规模语言预训练模型(LLM)进行指令微调,构建了ChatFlowFlood信息抽取模型,可以在少量人工标记情况下,准确自动抽取被困情况、紧缺物资等信息;在信息抽取模型的基础上,通过模糊层次分析法(FAHP)和CRITIC法(CRiteria Importance Through Intercriteria Correlation)主客观结合评定求助信息的救援优先级,帮助决策者理解灾情紧急程度。实验结果表明,在中文社交媒体数据上,与ChatFlow-7B模型相比,ChatFlowFlood模型的FBERT指标提升了73.09%。

    数据科学与技术
    基于树分解的时序最短路径计数查询算法
    李源, 林秋兰, 陈安之, 杨国利, 宋威, 王国仁
    2024, 44(8):  2446-2454.  DOI: 10.11772/j.issn.1001-9081.2023081128
    摘要 ( )   HTML ( )   PDF (1666KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    最短路径计数是图计算中的一个重要研究问题,旨在查询顶点间的最短路径数,在路径规划与推荐、社交网络分析、介数中心性计算等领域中具有广泛应用。目前越来越多的网络可以建模为时序图,但少有针对时序图最短路径计数查询问题的研究工作。与静态图相比,时序图增加了时间信息,结构更复杂,在查询顶点间的路径数时必须考虑边的激活时间,因此静态图中最短路径计数方法不再适用于时序图,并且在大规模时序图上查询更具有挑战性。针对时序图最短路径计数问题,提出一种基于树分解构建TG-TL(Temporal Graph-Tree Label)索引的方法。该方法包含构建索引和在线查询两个阶段,构建索引阶段根据时序图的属性设计时序树分解算法,将时序图转化为树结构;然后根据树分解的结构信息以及凸路径定义提出高效构建索引算法;在线查询阶段基于TG-TL索引提出了高效的时序最短路径计数查询算法。在4个真实数据集上的实验结果表明,与基于TG-base(Temporal Graph-base)索引的查询算法相比,所提算法在查询效率上至少提升了61%,因此所提算法在时序图最短路径计数问题上具有高效性和有效性。

    支持关键词搜索的top-K条最优路线查询问题
    赵浩宇, 于自强, 陈晓萌, 陈国祥, 朱慧, 李博涵
    2024, 44(8):  2455-2465.  DOI: 10.11772/j.issn.1001-9081.2023081267
    摘要 ( )   HTML ( )   PDF (2879KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    支持关键词搜索的top-K条最优路线查询问题是针对给定的道路网络、兴趣点集合、起点和多个关键词的路线查询。查询旨在找到途经与查询关键词匹配的多个兴趣点的k条最优路线。然而,一些现有研究为降低算法的复杂度,将用户输入关键词的顺序作为到达兴趣点顺序,不适用于对兴趣点到达顺序没有要求的场景,降低了实用性;另一些研究为提高查询效率,设定距离阈值对不符合要求的兴趣点剪枝,然而这类算法无法保证被剪枝的兴趣点一定不能组成最优路线。针对上述问题,提出一种关键词感知的top-K最优路线搜索(KKRS)算法。首先,将整个道路网络划分为多个子网络。然后,采用启发式搜索策略从查询起点所在的子网络开始逐步扩展搜索范围,直至找到top-K条最优路线或遍历完整个道路网络。在扩展过程中,引入子图剪枝策略,用于剪去不包含top-K最优路线的子网络,缩小搜索范围。此外,为避免对每个可能构成最优路线的兴趣点集合依次计算,设计兴趣点序列的剪枝策略,以快速过滤不可能构成最优路线的兴趣点序列,降低计算代价。最后,在真实数据集和合成数据集上对提出的两种剪枝算法进行实验,实验结果表明这两种算法在所有数据集上的子图剪枝上都能达到70%以上的剪枝率,在兴趣点序列剪枝上则能保证60%以上的剪枝率。与目前已有的先进算法大规模路网图下关键词覆盖最优路径查询(KORL)、ROSE-GM(Recurrent Optimal Subroute Expansion Using Greedy Merge Strategy)、OSSCaling和StarKOSR(finding Top-K Optional Sequenced Routes with A*)相比,KKRS算法比对比算法中查询效率较高的StarKOSR算法提高了40%。

    基于样本势和噪声进化的不平衡数据过采样方法
    冷强奎, 孙薛梓, 孟祥福
    2024, 44(8):  2466-2475.  DOI: 10.11772/j.issn.1001-9081.2023081145
    摘要 ( )   HTML ( )   PDF (2780KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在处理不平衡数据分类问题中,过采样方法是一种有效的策略。现有方法大多采用K近邻(KNN)技术选取采样种子样本,但KNN参数值的改变会导致多数过采样方法表现出明显的不适定性。径向基过采样(RBO)方法能解决这个问题,但在采样后易出现大量噪声。基于此,提出一种基于样本势和噪声进化的不平衡数据过采样方法,进一步对采样后的数据集迭代进化。首先,使用RBO方法通过计算样本势合成少数类样本,并改善原始数据的不平衡;其次,使用自然近邻(NaN)作为错误检测技术检测过采样后数据集中存在的疑似噪声样本;最后,利用改进的差分进化(DE)方法对检测出的疑似噪声样本迭代进化。相较于传统过采样方法,所提方法能更充分挖掘数据集中的重要边界信息,从而为分类器提供更多辅助以改善其分类性能。在22个基准数据集上,与7种经典采样方法(结合3种不同分类器)进行了大量对比实验。实验结果表明,所提方法具有更高的F1值和G-mean值,并且在噪声处理方面也优于带有后置过滤器的采样方法,可以更有效地解决不平衡数据分类问题。此外,统计分析也表明它的弗里德曼排名更高。

    融合异构信息的自动国际疾病分类编码方法
    张全梅, 黄润萍, 滕飞, 张海波, 周南
    2024, 44(8):  2476-2482.  DOI: 10.11772/j.issn.1001-9081.2023081166
    摘要 ( )   HTML ( )   PDF (2137KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对自动国际疾病分类(ICD)编码中医学电子健康记录(EHR)的结构多样性以及编码间复杂的关联关系等特点,提出一种融合异构信息的自动ICD编码方法AIC-HI(Automatic ICD Coding integrating Heterogeneous Information)。首先,针对编码任务中结构化编码、半结构化描述、非结构化医学文本这3种异构数据的不同特性设计了多种特征提取器;其次,构建编码知识图谱拟合编码的层次结构关系,将不同分支间关联关系转化为包含头尾编码的三元组;再次,运用表征学习融合编码和描述信息计算标签特征;最后,通过注意力机制提取在非结构化文档中与编码标签最为相关的特征表示。实验结果表明,与次优的基线模型MARN(Multitask bAlanced and Recalibrated Network)相比,AIC-HI在真实临床数据集MIMIC-Ⅲ上所有编码的微观F1值提升了4.3个百分点。

    网络空间安全
    面向图神经网络模型提取攻击的图数据生成方法
    杨莹, 郝晓燕, 于丹, 马垚, 陈永乐
    2024, 44(8):  2483-2492.  DOI: 10.11772/j.issn.1001-9081.2023081110
    摘要 ( )   HTML ( )   PDF (3213KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    无数据模型提取攻击是基于攻击者在进行攻击时所需的训练数据信息未知的情况下提出的一类机器学习安全问题。针对无数据模型提取攻击在图神经网络(GNN)领域的研究缺乏,提出分别用GNN可解释性方法GNNExplainer和图数据增强方法GAUG-M优化图节点特征信息和边信息生成所需图数据,最终提取GNN模型的方法。首先,利用GNNExplainer方法对目标模型的响应结果进行可解释性分析得到重要的图节点特征信息;其次,通过对重要的图节点特征加权,对非重要图节点特征降权,实现图节点特征信息的整体优化;然后,使用图形自动编码器作为边信息预测模块,根据优化后的图节点特征得到节点与节点之间的连接概率;最后,根据概率增加或者删减相应边优化边信息。实验采用5个图数据集训练的3种GNN模型架构作为目标模型提取攻击,得到的替代模型达到了73%~87%的节点分类任务准确性和76%~89%的与目标模型性能的一致性,验证了所提方法的有效性。

    融合1D-CNN与BiGRU的类不平衡流量异常检测
    陈虹, 齐兵, 金海波, 武聪, 张立昂
    2024, 44(8):  2493-2499.  DOI: 10.11772/j.issn.1001-9081.2023081112
    摘要 ( )   HTML ( )   PDF (1194KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    网络流量异常检测是利用各种检测技术分析判断网络流量,发现网络中潜在的攻击,是一种有效的网络安全防护方法。针对高维海量数据和不同攻击类别的网络流量数据不均衡而导致检测准确率低、误报率高的问题,提出一种融合一维卷积神经网络(1D-CNN)和双向门控循环单元(BiGRU)的类不平衡流量异常检测模型。首先,针对类不平衡数据,通过使用改进的合成少数类过采样技术(SMOTE)即Borderline-SMOTE和基于高斯混合模型(GMM)的欠采样聚类技术进行平衡处理;然后,使用1D-CNN提取数据的局部特征,并利用BiGRU更好地提取数据中的时序特征;最后,在UNSW-NB15数据集对所提模型进行验证,所提模型的准确率为98.12%,误报率为1.28%。结果表明,所提模型提高了对少数攻击的识别率,检测精度高于其他经典机器学习和深度学习模型。

    基于区块链的动态密文排序检索方案
    孙晓玲, 王丹辉, 李姗姗
    2024, 44(8):  2500-2505.  DOI: 10.11772/j.issn.1001-9081.2023081114
    摘要 ( )   HTML ( )   PDF (1741KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为解决云存储服务器不可信问题,提出基于区块链的动态密文排序检索方案。首先,采用树形索引结构,可达到亚线性的检索效率;使用向量空间模型,降低了文本的复杂度;其次,利用词频-逆文档频率(TF-IDF)加权统计算法实现了多关键词检索结果的排序;再次,采用为新添加的文件单独建立索引树、为删除文件建立删除列表的方法,动态更新区块链上可搜索加密方案;最后,通过泄漏函数证明了所提方案对自适应选择关键词攻击的安全性。性能测试结果表明,所提方案采用的树形索引结构相较于{key,value}索引结构,索引树生成时间平均降低了98%、文件搜索时间平均降低了7%、动态更新时间平均降低了99%,各阶段效率均有明显提高。

    网络与通信
    改进猎人猎物优化算法在WSN覆盖中的应用
    杨乐, 张达敏, 何庆, 邓佳欣, 左锋琴
    2024, 44(8):  2506-2513.  DOI: 10.11772/j.issn.1001-9081.2023081208
    摘要 ( )   HTML ( )   PDF (6422KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对传统无线传感器网络(WSN)节点部署覆盖盲区大、分布不均等问题,提出一种改进的猎人猎物优化(IHPO)算法优化网络覆盖。首先,在猎物位置更新阶段,引入差分进化(DE)思想并借助动态比例因子进行交叉变异,从而增强种群信息交流;其次,在全局最优位置更新阶段,由α稳定分布提出自适应α变异对全局最优位置进行扰动,从而平衡不同时期算法的性能需求;最后,利用自适应α变异扰动的全局最优位置引导种群完成动态反向学习,从而增加种群的全局搜索能力和多样性。在WSN覆盖问题中,使用IHPO优化的网络节点分布更均匀、覆盖率更高,在传感器感知能力不足时能达到92.56%的覆盖率,对比原始HPO算法优化的节点提高了25.74%,对比改进粒子群优化(IPSO)算法、改进灰狼优化算法(IGWO)优化的节点分别提高了13.98%、16.41%。同时,IHPO算法优化的节点能耗更均衡,在路由测试中的网络工作时间可以延长至2 500轮次。

    基于改进广义正交匹配追踪的低地球轨道卫星MIMO-OTFS系统的信道估计方法
    雷芳, 牛永才
    2024, 44(8):  2514-2520.  DOI: 10.11772/j.issn.1001-9081.2023081170
    摘要 ( )   HTML ( )   PDF (2232KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对基于多输入多输出(MIMO)技术和正交时频空间(OTFS)调制的低地球轨道卫星系统的复杂性带来的信道估计困难问题,提出一种基于改进广义正交匹配追踪(GOMP)的信道估计方法。根据单输入单输出(SISO)-OTFS系统的输入输出关系和低地球轨道卫星信道的传播特性,建立一种基于MIMO-OTFS的低地球轨道卫星信道模型,并将系统的信道估计问题转化为稀疏信号的恢复问题。考虑到传统的GOMP算法存在对稀疏度的过度依赖和对稀疏信号的重构精度差等问题,所提方法结合了分段弱正交匹配追踪(SWOMP)的弱选择思想和广义Jaccard系数的相似性准则,以快速准确地重建稀疏信号。仿真结果表明,当天线数为16且导频开销比为0.5时,与正交匹配追踪(OMP)算法相比,所提方法的归一化均方误差(NMSE)降低了约2.5 dB,误码率(BER)降低了约5 dB。

    基于特征梯度均值化的调制信号对抗样本攻击算法
    石锐, 李勇, 朱延晗
    2024, 44(8):  2521-2527.  DOI: 10.11772/j.issn.1001-9081.2023081165
    摘要 ( )   HTML ( )   PDF (2546KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对调制瞄准干扰通过深度神经网络(DNN)识别信号调制方式,进而发起灵巧干扰使通信性能下降的问题,提出一种基于特征梯度均值化的调制信号对抗样本攻击算法。不同于传统的标签反向传播求取梯度的方法,所提算法利用调制信号在DNN高维空间中的丰富空时特征计算梯度,并使用局部平均特征梯度代替单点特征梯度用于算法迭代,解决损失函数曲面局部振荡带来的梯度不可靠问题。基于处理后的梯度和现有动量攻击方法,可生成更精细的对抗扰动,并叠加在正常通信信号上以构造对抗样本,降低DNN对通信信号的识别准确率,减弱调制瞄准干扰的效果。在RADIOML 2016.10A数据集上的实验结果表明,与快速梯度符号法(FGSM)、MI-FGSM(Momentum Iterative Fast Gradient Sign Method)相比,尽管所提算法在VTCNN2(Visual Transformer Convolutional Neural Network)模型上的运行时间分别增加了1.36 h、0.58 h,但生成的无目标对抗样本取得了显著的效果。当信噪比为10 dB时,白盒攻击成功率分别提升了36、26个百分点,将生成的对抗样本直接迁移到CLDNN(Convolutional Long short-term memory-Deep Neural Network)模型中,黑盒攻击成功率分别提升了19和14个百分点。所提算法提高了对抗样本的攻击成功率,具有良好的可迁移性。

    计算机软件技术
    基于自适应敏感区域变异的覆盖引导模糊测试
    徐航, 杨智, 陈性元, 韩冰, 杜学绘
    2024, 44(8):  2528-2535.  DOI: 10.11772/j.issn.1001-9081.2023081177
    摘要 ( )   HTML ( )   PDF (2341KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对覆盖引导的模糊测试(CGF)中存在大量无效变异且造成性能浪费的问题,提出一种自适应敏感区域变异算法。首先,根据变异出的测试用例是否执行新路径将对应的变异位置分为有效变异位置集合和无效变异位置集合;然后,基于有效变异位置确定敏感区域,将后续的变异集中在敏感区域内。在后续的模糊测试过程中,根据测试用例的执行结果自适应地调整对应种子的敏感区域,减少无效变异。此外,设计新的种子选择策略配合敏感区域变异。将自适应敏感区域算法集成至美国模糊循环(AFL),并将它命名为SMAFL(Sensitive-region-based Mutation American Fuzzy Lop)。在12个流行的应用程序上评估SMAFL,实验结果表明,与AFL相比,当初始种子数为1时,SMAFL发现的路径数平均提升了31.4%,模糊次数增加了3.4倍;并且在12个程序中都实现了更高的代码覆盖率。在对LAVA-M数据集的测试中,SMAFL比AFL多发现2个bug,并且发现相同bug所用时间更短。整体地,自适应敏感区域变异算法能提升模糊测试器的探索效率。

    无人系统数据融合流水线架构设计
    刘艺, 杨国利, 郑奇斌, 李翔, 周杨森, 陈德鹏
    2024, 44(8):  2536-2543.  DOI: 10.11772/j.issn.1001-9081.2023081184
    摘要 ( )   HTML ( )   PDF (2572KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    传感器是无人系统智能化行动的基础,而通过融合多传感器的数据能增强无人系统的智能感知和自主决策能力,提升无人系统的可靠性和鲁棒性。无人系统的数据融合面临传感器类型多样、数据格式异构、数据融合分析的实时性强,以及算法模型种类复杂、更新演化快等挑战,传统定制化开发前端融合模型和基于后端融合平台的方法难以适用。因此,提出一种面向数据融合的流水线平台,以支持数据自动转换、算法灵活组合、模型高可配置、功能快速迭代,且能面向任务,动态、快速构建数据融合模型并提供信息服务。在剖析无人系统数据融合流程和技术体系的基础上,设计流水线框架及其关键功能构件,分析亟待突破的关键技术,给出框架的运行方式和实际案例,探讨未来的发展方向。

    多媒体计算与计算机仿真
    基于图像的端到端行人搜索算法综述
    王翠, 邓淼磊, 张德贤, 李磊, 杨晓艳
    2024, 44(8):  2544-2550.  DOI: 10.11772/j.issn.1001-9081.2023081195
    摘要 ( )   HTML ( )   PDF (1456KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    行人搜索是计算机视觉领域中重要的研究方向之一,旨在从未剪裁的图像库中检测和识别人物。为深入了解行人搜索算法,总结与分析大量相关文献。首先根据网络结构的不同,将行人搜索算法分为两类:一类是传统的两步法,一类是基于端到端的一步法,并重点分析和介绍一步法的关键技术——特征学习和度量学习。然后,介绍了行人搜索领域的数据集和评价指标,比较与分析主流算法性能。实验结果表明,两步法虽然实现了很好的性能,但大多数的方法计算成本较高,且耗时较长;而一步法可以在更高效的学习框架中共同解决行人检测和行人重识别2个子任务,效果更好。最后,总结行人搜索算法,并展望了未来的发展方向。

    基于骨架图与混合注意力的视频行人异常检测方法
    刘禹含, 吉根林, 张红苹
    2024, 44(8):  2551-2557.  DOI: 10.11772/j.issn.1001-9081.2023081157
    摘要 ( )   HTML ( )   PDF (2081KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    近些年,许多利用人体骨架图检测视频异常的研究在描述人体骨架连接强弱时,只考虑到直接相连的节点,关注的运动区域较小且忽略了局部特征,很难准确检测行人异常事件。为解决以上问题,提出一种基于骨架图与混合注意力的视频行人异常检测方法(PAD-SGMA)。首先,扩展骨架点之间的关联,连接根节点与未直接相连的节点,并划分人体骨架图,获取人体骨架局部特征,在图卷积模块中利用静态全局骨架、局部区域骨架和基于注意的邻接矩阵来捕获层次表示;其次,提出新的时空通道混合注意图卷积网络,增加混合注意力模块,关注空间和通道关系,帮助模型增强区分特征且不同程度地关注每个关节。为了验证所提模型,在大规模的公开标准数据集ShanghaiTech Campus上进行实验,结果表明,与GEPC(Graph Embedded Pose Clustering)相比,PAD-SGMA的AUC(Area Under Curve)提高了0.018。

    非线性时间一致性的相关滤波目标跟踪
    姜文涛, 李宛宣, 张晟翀
    2024, 44(8):  2558-2570.  DOI: 10.11772/j.issn.1001-9081.2023081121
    摘要 ( )   HTML ( )   PDF (7942KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有目标跟踪算法主要采用线性约束机制LADCF(Learning Adaptive Discriminative Correlation Filters)跟踪模型容易漂移的问题,提出非线性时间一致性的相关滤波目标跟踪算法。首先,结合史蒂文斯定律,提出贴近人类视觉感知特性的非线性时间一致项,使模型相对平滑地跟踪目标,从而保证跟踪连续性,避免跟踪模型漂移;其次,采用交替方向乘子法(ADMM)求解最优函数值,保证算法的跟踪实时性;最后,利用史蒂文斯定律非线性更新滤波器,使滤波器更新因子可以根据目标的变化增强和抑制滤波器,以适应目标变化,防止滤波器退化。在4个标准数据集上与主流相关滤波和深度学习算法对比实验,相较于基线算法LADCF,所提算法的跟踪精确度和成功率在OTB100数据集上分别提升了2.4和3.8个百分点;在UAV123上分别提升了1.5和2.5个百分点。实验结果表明,所提算法能有效避免跟踪模型漂移,降低滤波器退化概率,跟踪精确度和成功率较高,面对遮挡、光照变化等复杂场景时具有较强的鲁棒性。

    基于局部和全局特征解耦的图像去噪网络
    丁宇伟, 石洪波, 李杰, 梁敏
    2024, 44(8):  2571-2579.  DOI: 10.11772/j.issn.1001-9081.2023081131
    摘要 ( )   HTML ( )   PDF (2935KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对当前基于Transformer的图像去噪算法侧重于捕获图像的全局特征,而忽视局部特征对于恢复图像细节关键作用的问题,提出一种基于局部和全局特征解耦的图像去噪网络。该网络包含2个基于混合Transformer模块(HTB)的多尺度分支和1个基于卷积神经网络(CNN)的单尺度分支,旨在将HTB强大的全局建模能力与CNN的局部建模优势有机结合,生成上下文信息丰富且空间细节准确的输出。HTB采用自注意力机制自适应地对空间和通道维度的依赖关系建模,以激活范围更广的输入像素进行重建。鉴于不同分支间可能存在的信息冲突,设计特征传递模块,通过跨分支传递全局特征并抑制低频信息,从而确保各分支间的协同作用。实验结果表明,在真实世界图像数据集SIDD上,与基于Transformer的去噪网络Uformer相比,所提网络的峰值信噪比(PSNR)提高了0.09 dB,结构相似度(SSIM)提高了0.001;在合成图像数据集Urban100上,与多阶段去噪网络MSPNet(Multi-Stage Progressive denoising Network)相比,所提网络的平均PSNR提高了0.41 dB。可见,所提网络能有效去除图像噪声,并重建出更精细的纹理细节。

    基于改进YOLOv5的Logo检测算法
    李烨恒, 罗光圣, 苏前敏
    2024, 44(8):  2580-2587.  DOI: 10.11772/j.issn.1001-9081.2023081113
    摘要 ( )   HTML ( )   PDF (4682KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对Logo图像背景复杂、Logo目标尺寸多变的问题,提出了一种基于YOLOv5的改进检测算法。首先,结合CBAM(Channel Block Attention Module),分别在图像通道与空间方向进行压缩,提取图像的关键信息与重要区域;然后,使用可变空洞卷积(SAC)使网络在不同尺度下自适应地调整特征图中的感受野大小,以捕获不同尺度下的物体信息,改善网络对多尺度目标的检测效果;最后,将归一化Wasserstein距离(NWD)嵌入损失函数,将边界框建模成2D的高斯分布,计算对应的高斯分布之间的相似度,更好地度量目标之间的相似性,提高对小目标的检测性能与模型鲁棒性和稳定性。实验结果表明,在数据量较小的数据集FlickrLogos-32中,改进后算法的平均精度均值(mAP@0.5)达到90.6%,比原始YOLOv5算法提升了1个百分点;在数据量较大的数据集QMULOpenLogo中,改进后算法的mAP@0.5达到62.7%,比原始YOLOv5算法提升了2.3个百分点;在针对特定类型的Logo检测集LogoDet3K中,针对3类商标改进后算法比原始算法的mAP@0.5分别提升了1.2、1.4与1.4个百分点,说明它有更好的Logo图像小目标检测能力。

    基于图像增强的低照度人脸检测
    李钟华, 白云起, 王雪津, 黄雷雷, 林初俊, 廖诗宇
    2024, 44(8):  2588-2594.  DOI: 10.11772/j.issn.1001-9081.2023081198
    摘要 ( )   HTML ( )   PDF (2413KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对人脸检测模型在低照度环境下出现的检测性能明显降低这一问题,提出一种基于图像增强的低照度人脸检测方法。首先,采用图像增强方法对低照度图像预处理,以增强人脸的有效特征信息;其次,在模型主干网络后引入注意力机制,以提升网络对人脸区域的关注,并同时降低非均匀光照与噪声带来的负面影响;此外,引入注意力边界框损失函数WIoU(Wise Intersection over Union),以提升网络对低质量人脸的检测准确率;最后,使用更有效的特征融合模块代替模型原有结构。在低照度人脸数据集DARK FACE上的实验结果表明,所提方法的平均检测精度AP@0.5相较于原始YOLOv7模型提升了2.4个百分点,精度平均值AP@0.5:0.95提升了1.4个百分点,并且不引入额外参数与计算量。另外,在其他2个低照度人脸数据集上的结果也表明所提方法的有效性与鲁棒性,证明所提方法适用于不同场景下的低照度人脸检测。

    改进掩码自编码器的工业缺陷检测方法
    邓凯丽, 魏伟波, 潘振宽
    2024, 44(8):  2595-2603.  DOI: 10.11772/j.issn.1001-9081.2023081122
    摘要 ( )   HTML ( )   PDF (4261KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对目前只需正常样本即可实现缺陷检测的方法存在漏检或过度检测的问题,构建一种改进掩码自编码器与改进Unet结合的方法实现像素级缺陷检测。首先,采用拟合缺陷模块生成缺陷掩码图像及正常图像对应的缺陷图像;其次,对缺陷图像随机掩码,去除缺陷图像大部分的缺陷信息,激励Transformer结构的自编码器从未掩码的正常区域学习表示并依据上下文修复缺陷图像,为了提高模型对细节的修复能力,设计了新的损失函数;最后,将缺陷图像与修复图像拼接后输入拥有通道方向交叉融合Transformer结构的Unet,实现像素级缺陷检测。实验结果表明,在MVTec AD数据集上,所提方法平均的基于图像的和基于像素的接受者操作特征曲线下的面积值(ROC AUC)分别达到了0.984和0.982,与DRAEM(Discriminatively trained Reconstruction Anomaly Embedding Model)相比分别提高了2.9和3.2个百分点;与CFLOW-AD(Anomaly Detection via Conditional normalizing FLOWs)相比分别提高了3.1和0.8个百分点,证明所提方法具有较高的识别率和检测精度。

    基于半监督和多尺度级联注意力的超声颈动脉斑块分割方法
    李晨倩, 刘俊
    2024, 44(8):  2604-2610.  DOI: 10.11772/j.issn.1001-9081.2023081197
    摘要 ( )   HTML ( )   PDF (1974KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    由于超声图像具有噪声强、质量低和边界模糊等特征,获取可靠的注释非常耗时费力,提出基于半监督和多尺度级联注意力的超声颈动脉斑块分割方法。首先,通过不确定性修正金字塔一致性(URPC)的半监督分割方法充分利用未标记数据训练模型减轻费时费力的标注压力。其次,提出一种基于边缘检测的双编码器结构,并利用边缘检测编码器辅助超声斑块图像特征编码器充分获取边缘信息;另外,设计了一个多尺度融合模块(MSFM),通过自适应融合多尺度特征改善提取不规则形状斑块的结果,并结合一个级联通道空间注意力(CCSA)模块更好地关注斑块区域;最后,在超声颈动脉斑块图像数据集上评估所提方法。实验结果表明,所提方法在该数据集上的Dice指标和交并比(IoU)指标比监督方法CA-Net(Comprehensive Attention convolutional neural Network)分别提升了约2.8和6.3个百分点,比半监督方法循环原型一致性学习(CPCL)分别提高了约1.8和1.3个百分点,所提方法可以有效提高超声颈动脉斑块图像的分割准确度。

    基于多路信息聚合协同解码的单通道语音增强
    莫尚斌, 王文君, 董凌, 高盛祥, 余正涛
    2024, 44(8):  2611-2617.  DOI: 10.11772/j.issn.1001-9081.2023081141
    摘要 ( )   HTML ( )   PDF (2371KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了改善基于卷积编解码架构的单通道语音增强网络对语音声学特征提取不充分、解码特征丢失严重的问题,提出一种基于多路信息聚合协同解码的单通道语音增强网络MIACD,通过双路编码器充分提取融入了语音自监督学习(SSL)表征的幅度谱和复数谱特征,由4层Conformer分别从时间和频率维度对提取特征建模,采用残差连接将双路编码器提取的语音幅度、复数特征引入三路信息聚合解码器,并利用所提通道-时频注意力(CTF-Attention)机制根据语音能量分布情况调节解码器中聚合信息,有效缓解解码时可用声学信息缺失严重的问题。在公开数据集Voice Bank DEMAND上的实验结果表明,与用于单通道语音增强的协作学习框架(GaGNet)相比,MIACD在客观评价指标宽带感知评估语音质量(WB-PESQ)上提升了5.1%,短时客观可懂度(STOI)达到96.7%,验证所提方法可充分利用语音信息重构信号,有效抑制噪声并提升语音可理解性。

    前沿与综合应用
    基于时空多图融合的交通流量预测
    顾焰杰, 张英俊, 刘晓倩, 周围, 孙威
    2024, 44(8):  2618-2625.  DOI: 10.11772/j.issn.1001-9081.2023081226
    摘要 ( )   HTML ( )   PDF (1979KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    交通预测是智能交通系统(ITS)的核心任务,准确的交通流量预测(TFF)可以大幅提高公共资源的利用效率。针对现有多图神经网络模型对上下文信息使用不足、图融合方法不平衡和只考虑静态空间关系等问题,提出基于时空多图融合(STMGF)的TFF模型。首先,通过融合空间图、语义图和空间语义图提取不同区域的不同空间相关性,并利用空间注意力机制和图注意力机制融合不同的图结构以动态学习不同邻居的重要性;然后,使用多核时间注意力机制同时捕获局部时间依赖性和全局时间依赖性;最后,使用多层感知机预测交通流量,得到最终预测值。在NYCTaxi和NYCBike数据集验证模型的有效性。实验结果表明,在NYCBike数据集的36步预测任务中,与时空图卷积神经网络(STGCN)、基于时空注意力的图神经网络(ASTGNN)、元图卷积递归网络(MegaCRN)相比,所提模型的均方根误差(RMSE)分别降低了8.46%、2.70%和2.20%。

    基于深度强化学习的多机器人路径跟随与编队
    何浩东, 符浩, 王强, 周帅, 刘伟
    2024, 44(8):  2626-2633.  DOI: 10.11772/j.issn.1001-9081.2023081120
    摘要 ( )   HTML ( )   PDF (3411KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对多机器人在人群环境中路径跟随与编队的避障及运动轨迹平滑性问题,提出基于深度强化学习的多机器人路径跟随与编队算法。首先,建立行人危险性优先级机制,结合行人危险性优先级机制与强化学习设计危险意识网络,提高多机器人编队的安全性;然后,引入虚拟机器人作为多机器人的跟随目标,将路径跟随转化为多机器人对虚拟机器人的跟随控制,提高机器人运动轨迹的平滑性;最后,通过仿真实验将所提算法与现有算法进行对比,同时进行定量与定性分析。实验结果表明,与现有点对点的路径跟随算法相比,所提算法在人群环境下具有优异的避障性能,可保证多机器人运动轨迹的平滑性。

    基于图注意力Transformer神经网络的信用卡欺诈检测模型
    杨帆, 邹窈, 朱明志, 马振伟, 程大伟, 蒋昌俊
    2024, 44(8):  2634-2642.  DOI: 10.11772/j.issn.1001-9081.2023081153
    摘要 ( )   HTML ( )   PDF (2474KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有模型无法精准识别复杂多变的团伙诈骗模式的问题,提出一种新型实用的基于复杂交易图谱的信用卡反欺诈检测模型。首先,利用用户原始的交易信息构造关联交易图谱;随后,使用图自注意力Transformer神经网络模块直接从交易网络中挖掘团伙欺诈特征,无需构建繁冗的特征工程;最后,通过欺诈预测网络联合优化图谱中的拓扑模式和时序交易模式,实现对欺诈交易的高精度检测。在信用卡交易数据上的反欺诈实验结果表明,所提模型在全部评价指标上均优于7个对比的基线模型:在交易欺诈检测任务中,平均精度(AP)比基准图注意力神经网络(GAT)提升了20%,ROC曲线下方面积(AUC)平均提升了2.7%,验证了所提模型在信用卡欺诈交易检测中的有效性。

    面向空气质量预测的多粒度突变拟合网络
    石乾宏, 杨燕, 江永全, 欧阳小草, 范武波, 陈强, 姜涛, 李媛
    2024, 44(8):  2643-2650.  DOI: 10.11772/j.issn.1001-9081.2023081169
    摘要 ( )   HTML ( )   PDF (1283KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    空气质量数据作为一种典型的时空数据,具有复杂的多尺度内在特性并存在突变的问题。针对现有空气质量预测方法在处理包含大量突变数据的空气质量预测任务时表现不佳的问题,提出一种面向空气质量预测的多粒度突变拟合网络(MACFN)。首先,针对空气质量数据在时间上的周期性,对输入数据进行了多粒度的特征提取。然后,采用图卷积网络与时间卷积网络分别提取空气质量数据的空间关联性与时间依赖性。最后,设计一个突变拟合网络自适应地学习数据中的突变部分,从而减小预测误差。所提网络在3个真实的空气质量数据集上进行了实验评估,与多尺度时空网络(MSSTN)相比,均方根误差(RMSE)分别下降约11.6%、6.3%和2.2%。实验结果表明,MACFN能有效捕捉复杂的时空关系,并在变化幅度较大、易发生突变的空气质量预测任务中有更好表现。

2025年 45卷 5期
刊出日期: 2025-05-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会