当期目录

    2023年 第43卷 第5期 刊出日期:2023-05-10
    第九届中国数据挖掘会议
    判别多维标度特征学习
    唐海涛, 王红军, 李天瑞
    2023, 43(5):  1323-1329.  DOI: 10.11772/j.issn.1001-9081.2022030419
    摘要 ( )   HTML ( )   PDF (1101KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    传统多维标度方法学习得到的低维嵌入保持了数据点的拓扑结构,但忽略了低维嵌入数据类别间的判别性。基于此,提出一种基于多维标度法的无监督判别性特征学习方法——判别多维标度模型(DMDS),该模型能在学习低维数据表示的同时发现簇结构,并通过使同簇的低维嵌入更接近,让学习到的数据表示更具有判别性。首先,设计了DMDS对应的目标公式,体现所学习特征在保留拓扑性的同时增强判别性;其次,对目标函数进行了推理和求解,并根据推理过程设计所对应的迭代优化算法;最后,在12个公开的数据集上对聚类平均准确率和平均纯度进行对比实验。实验结果表明,根据Friedman统计量综合评价DMDS在12个数据集上的性能优于原始数据表示和传统多维标度模型的数据表示,它的低维嵌入更具有判别性。

    改进的基于多路径特征的胶囊网络
    徐清海, 丁世飞, 孙统风, 张健, 郭丽丽
    2023, 43(5):  1330-1335.  DOI: 10.11772/j.issn.1001-9081.2022030367
    摘要 ( )   HTML ( )   PDF (1560KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对胶囊网络(CapsNet)在复杂数据集上的分类效果差,而且在路由过程中参数数量过大等问题,提出一种基于多路径特征的胶囊网络(MCNet),包含新的胶囊特征提取器和新的胶囊池化方法。该胶囊特征提取器从多个不同路径中并行地提取不同层次、不同位置的特征,然后将特征编码为包含更多语义信息的胶囊特征;胶囊池化方法则在胶囊特征图的每个位置选取最活跃的胶囊,用少量的胶囊表示有效的胶囊特征。在4个数据集(CIFAR-10、SVHN、Fashion-MNIST、MNIST)上与CapsNet等模型进行了对比。实验结果显示,MCNet在CIFAR-10数据集上的分类准确率为79.27%,可训练的参数数量为6.25×106,与CapsNet相比,MCNet的分类准确率提升了8.7%,参数数量减少了46.8%。MCNet能够有效提升分类准确率,同时减少可训练的参数数量。

    属性聚类下三支概念的对比
    张晓燕, 王佳一
    2023, 43(5):  1336-1341.  DOI: 10.11772/j.issn.1001-9081.2022030399
    摘要 ( )   HTML ( )   PDF (471KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    三支概念分析是人工智能领域一个非常重要的研究方向,该理论最大的优势是可以同时研究形式背景中对象“共同具有”和“共同不具有”的属性。众所周知,经过属性聚类生成的新形式背景与原形式背景具有较强的联系,同时原三支概念与经过属性聚类得到的新三支概念也存在紧密的内在联系。为此,进行属性聚类下三支概念的对比研究和分析。首先基于属性聚类提出悲观属性聚类、乐观属性聚类以及一般属性聚类的概念,并研究了这三种属性聚类的关系;然后,通过对比聚类过程与三支概念形成的过程,研究了原三支概念与新三支概念的区别,分别从面向对象和面向属性的角度提出两个最低约束指数,探索了属性聚类对三支概念格的影响,进一步丰富了三支概念分析理论,为可视化数据处理领域提供了可行的思路。

    迭代修正鲁棒极限学习机
    吕新伟, 鲁淑霞
    2023, 43(5):  1342-1348.  DOI: 10.11772/j.issn.1001-9081.2022030429
    摘要 ( )   HTML ( )   PDF (823KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    极限学习机(ELM)的许多变体都致力于提高ELM对异常点的鲁棒性,而传统的鲁棒极限学习机(RELM)对异常点非常敏感,如何处理数据中的过多极端异常点变成构建RELM模型的棘手问题。对于残差较大的异常点,采用有界损失函数消除异常点对模型的污染;为了解决异常点过多的问题,采用迭代修正技术修改数据以降低由异常点过多带来的影响。结合这两种方法,提出迭代修正鲁棒极限学习机(IMRELM)。IMRELM通过迭代的方式求解,在每次的迭代中,通过对样本重加权减小异常点的影响,在不断修正的过程中避免算法出现欠拟合。在具有不同异常点水平的人工数据集和真实数据集上对比了IMRELM、ELM、加权极限学习机(WELM)、迭代重加权极限学习机(IRWELM)和迭代重加权正则化极限学习机(IRRELM)。在异常点占比为80%的人工数据集上,IRRELM的均方误差(MSE)为2.450 44,而IMRELM的MSE为0.000 79。实验结果表明,IMRELM在具有过多极端异常点的数据上具有良好的预测精度和鲁棒性。

    基于判别性矩阵分解的多标签跨模态哈希检索
    谭钰, 王小琴, 蓝如师, 刘振丙, 罗笑南
    2023, 43(5):  1349-1354.  DOI: 10.11772/j.issn.1001-9081.2022030424
    摘要 ( )   HTML ( )   PDF (929KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的跨模态哈希算法低估了不同类别标签之间语义差异的重要性,忽略了哈希向量的平衡条件,导致所学习到的哈希码的判别性能差。此外,一些方法利用标签信息构造相似性矩阵,并将多标签数据视为单标签数据进行建模,这在多标签跨模态检索中造成了较大的语义损失。为了保留异构数据之间精确的相似程度和哈希向量的平衡特性,提出了一种新的有监督哈希算法——基于判别性矩阵分解的多标签跨模态哈希检索(DMFH)。该方法利用核化特征的协同矩阵分解(CMF)获得了一个共享的隐式子空间;同时利用数据之间共有标签的比例来描述异构数据的相似程度;此外,利用标签的平衡信息构造平衡矩阵,生成具有平衡特性的哈希向量,并最大化不同类别标签之间的类间距。在两个常用多标签数据集MIRFlickr和NUS-WIDE上与7种先进的跨模态哈希方法进行对比,在“以图搜文”(I2T)和“以文搜图”(T2I)任务上,DMFH均取得了最高的平均精度均值(mAP),而且T2I任务的mAP更优,说明DMFH能够更有效地利用文本模态中的多标签语义信息。还分析了所构造的平衡矩阵与相似性矩阵的有效性,验证了DMFH算法能有效保持语义信息和相似性关系,在多标签跨模式检索中是有效的。

    基于协同变异与莱维飞行策略的教与学优化算法及其应用
    高昊, 张庆科, 卜降龙, 李俊青, 张化祥
    2023, 43(5):  1355-1364.  DOI: 10.11772/j.issn.1001-9081.2022030420
    摘要 ( )   HTML ( )   PDF (2787KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对教与学优化(TLBO)算法在处理优化问题时存在搜索不均衡、易陷入局部最优、综合求解性能弱等缺陷,提出一种基于均衡优化与莱维飞行策略的改进教与学优化算法ELMTLBO。首先设计精英均衡引导策略,通过种群中多个精英个体的均衡引导提高算法的全局寻优能力;其次在TLBO算法的学习者阶段后,利用自适应权重策略对莱维飞行产生的步长进行自适应缩量,以提高种群局部寻优能力,增强个体对复杂环境的自适应性;最后设计了变异算子池逃逸策略,通过多个变异算子的协同引导,提升算法的种群多样性。为验证算法改进的有效性,将EMLTLBO算法与侏儒猫鼬优化算法(DMOA)等先进的智能优化算法以及平衡教与学优化(BTLBO)算法、标准TLBO等同类型算法在15个国际测试函数上进行综合收敛性能比较。统计实验结果表明,与先进的智能优化算法和TLBO算法变体相比,ELMTLBO算法能够有效平衡其搜索能力,不但有效求解单峰和多峰问题,而且在复杂多峰问题上仍有显著的寻优能力。在不同策略的共同作用下,ELMTLBO算法的综合优化性能突出,全局收敛性能较为稳定。此外,ELMTLBO算法成功应用于基于隐马尔可夫模型(HMM)的多序列比对(MSA)问题中,优化后得到的高质量对齐序列可用于疾病诊断、基因溯源等,可为生物信息学提供算法支撑。

    J-SGPGN:基于序列与图的联合学习复述生成网络
    侯志荣, 范晓东, 张华, 马晓楠
    2023, 43(5):  1365-1371.  DOI: 10.11772/j.issn.1001-9081.2022040626
    摘要 ( )   HTML ( )   PDF (951KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    复述生成是一种基于自然语言生成(NLG)的文本数据增强方法。针对基于Seq2Seq (Sequence-to-Sequence)框架的复述生成方法中出现的生成重复、语意错误及多样性差的问题,提出一种基于序列与图的联合学习复述生成网络(J-SGPGN)。J-SGPGN的编码器融合了图编码和序列编码进行特征增强,而解码器中则设计了序列生成和图生成两种解码方式并行解码;然后采用联合学习方法训练模型,旨在兼顾句法监督与语义监督以同步提升生成的准确性和多样性。在Quora数据集上的实验结果表明,J-SGPGN的生成准确性指标METEOR (Metric for Evaluation of Translation with Explicit ORdering)较准确性最优基线模型——RNN+GCN提升了3.44个百分点,生成多样性指标Self-BLEU (Self-BiLingual Evaluation Understudy)较多样性最优基线模型——多轮回译复述生成(BTmPG)模型降低了12.79个百分点。J-SGPGN能够生成语义更准确、表达方式更多样的复述文本。

    融合人体全身表观特征的行人头部跟踪模型
    张广耀, 宋纯锋
    2023, 43(5):  1372-1377.  DOI: 10.11772/j.issn.1001-9081.2022030377
    摘要 ( )   HTML ( )   PDF (2258KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的行人多目标跟踪模型在密集场景下存在行人无法检出以及帧间关联混淆的问题。为了提高密集场景下行人跟踪的精确率,提出一种融合全身表观特征的行人头部跟踪模型HT-FF (Head Tracking with Full-body Features)。首先,使用行人头部检测器替代全身检测器,提高密集场景下行人的检出率;其次,利用人体姿态估计的信息为引导,获得去噪声的全身表观特征作为跟踪线索,大幅减少多帧之间关联时发生的混淆。HT-FF模型在密集场景下行人跟踪的基准数据集Head Tracking 21 (HT21)上的MOTA (Multiple Object Tracking Accuracy)和IDF1 (ID F1 Score)等多个指标上取得了最优的结果。HT-FF模型能有效缓解密集场景下行人跟踪丢失和混淆的问题,所提出的融合多线索的跟踪模型是行人跟踪任务的新范式。

    融合市场动态层次宏观信息的股票趋势预测
    张亚飞, 王晶, 赵耀帅, 武志昊, 林友芳
    2023, 43(5):  1378-1384.  DOI: 10.11772/j.issn.1001-9081.2022030400
    摘要 ( )   HTML ( )   PDF (1401KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    股票市场结构复杂、信息多样,股票趋势预测极具挑战性。但现有研究大都把每只股票当作一个独立的个体,或者使用图结构对股票市场中复杂的高阶关系进行建模,缺少对股票、行业、市场三者间相互影响的层次性和动态性考量。针对上述问题,提出一种动态宏观记忆网络(DMMN),并基于DMMN同时对多只股票进行价格趋势预测。该方法按照“股票-行业-市场”的层次对市场宏观环境信息进行建模,并捕获这些信息在时序上的长期依赖;然后将市场宏观环境信息与股票微观特征信息动态融合,在增强个股对市场整体情况的感知能力的同时间接捕获到股票、行业、市场三者间的相互依赖。在收集的CSI300数据集上得到的实验结果表明,相较于基于注意力长短期记忆(ALSTM)网络、添加了图卷积的LSTM网络(GCN-LSTM)、卷积神经网络(CNN)等模型的股票预测方法,基于DMMN的方法在F1分数、夏普比率上都取得了更好的效果,和表现最优的对比方法ALSTM相比分别提升了4.87%和31.90%,这表明DMMN在具备较好预测性能的同时还具备更好的实用价值。

    基于多尺度核自适应滤波的股票收益预测
    汤兴恒, 郭强, 徐天慧, 张彩明
    2023, 43(5):  1385-1393.  DOI: 10.11772/j.issn.1001-9081.2022030401
    摘要 ( )   HTML ( )   PDF (1992KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在股票市场中,投资者可通过捕捉历史数据中潜在的交易模式实现对股票未来收益的预测,股票收益预测问题的关键在于如何准确地捕捉交易模式,但受公司业绩、金融政策以及国家经济增长等不确定性因素的影响,交易模式往往难以捕捉。针对该问题,提出一种多尺度核自适应滤波(MSKAF)方法,从过去的市场数据中捕捉多尺度交易模式。为刻画股票的多尺度特征,该方法采用平稳小波变换(SWT)得到不同尺度的数据分量,不同尺度的数据分量蕴含着股票价格波动背后潜在的不同交易模式,然后采用核自适应滤波(KAF)方法捕捉不同尺度的交易模式,以预测股票未来收益。实验结果表明,相较于基于两阶段核自适应滤波(TSKAF)的预测模型,所提方法的预测结果的平均绝对误差(MAE)减小了10%,夏普比率增加了8.79%,可见所提方法实现了更好的股票收益预测性能。

    基于烛台图模式匹配的PM2.5扩散特征的提取
    许睿, 梁爽, 万航, 文益民, 沈世铭, 李建
    2023, 43(5):  1394-1400.  DOI: 10.11772/j.issn.1001-9081.2022030437
    摘要 ( )   HTML ( )   PDF (2423KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有大气质量预测方法多基于单纯的时间序列数据进行趋势预测,忽略了污染物传输和扩散规律及其分类间模式特征的问题。为此,提出一种基于烛台图模式匹配(CPM)的PM2.5(大气细颗粒物污染)扩散特征提取方法。首先,利用基于卷积神经网络(CNN)的卷积思想从大量历史PM2.5序列中生成基础周期烛台图;然后,通过距离公式对不同烛台图特征向量的浓度模式进行聚类分析;最后,结合CNN在图像识别中的独特优势,形成融合图形特征与时序特征序列的混合模型,判断带有反转信号的烛台图将导致的趋势反转情况。在桂林市大气质量在线监测站的监测时序数据集上的实验结果表明,与使用单一时间序列数据的深度卷积神经网络VGG(Visual Geometry Group)相比,基于CPM的提取方法准确率提升了1.9个百分点。可见,基于CPM的方法能有效提取PM2.5趋势特征,可以用于预测未来污染物浓度周期变化。

    人工智能
    基于NSGA‑Ⅱ的自适应多尺度特征通道分组优化算法
    王彬, 向甜, 吕艺东, 王晓帆
    2023, 43(5):  1401-1408.  DOI: 10.11772/j.issn.1001-9081.2022040581
    摘要 ( )   HTML ( )   PDF (3248KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对轻量型卷积神经网络(LCNN)的精确度和复杂度均衡优化问题,提出基于快速非支配排序遗传算法(NSGA-Ⅱ)的自适应多尺度特征通道分组优化算法对LCNN特征通道分组结构进行优化。首先,将LCNN中的特征融合层结构的复杂度最小化和精确度最大化作为两个优化目标,进行双目标函数建模及理论分析;然后,设计基于NSGA-Ⅱ的LCNN结构优化框架,并在原始LCNN结构的深度卷积层之上增加基于NSGA-Ⅱ的自适应分组层,构建基于NSGA-Ⅱ的自适应多尺度的特征融合网络NSGA2-AMFFNetwork。在图像分类数据集上的实验结果显示,与手工设计的网络结构M_blockNet_v1相比,NSGA2-AMFFNetwork的平均精确度提升了1.220 2个百分点,运行时间降低了41.07%。这表明所提优化算法能较好平衡LCNN的复杂度和精确度,同时还可为领域知识不足的普通用户提供更多性能表现均衡的网络结构选择方案。

    基于图注意力网络的全局图像描述生成方法
    隋佳宏, 毛莺池, 于慧敏, 王子成, 平萍
    2023, 43(5):  1409-1415.  DOI: 10.11772/j.issn.1001-9081.2022040513
    摘要 ( )   HTML ( )   PDF (2508KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有图像描述生成方法仅考虑网格的空间位置特征,网格特征交互不足,并且未充分利用图像的全局特征。为生成更高质量的图像描述,提出一种基于图注意力网络(GAT)的全局图像描述生成方法。首先,利用多层卷积神经网络(CNN)进行视觉编码,提取给定图像的网格特征和整幅图像特征,并构建网格特征交互图;然后,通过GAT将特征提取问题转化成节点分类问题,包括一个全局节点和多个局部节点,更新优化后可以充分利用全局和局部特征;最后,基于Transformer的解码模块利用改进的视觉特征生成图像描述。在Microsoft COCO数据集上的实验结果表明,所提方法能有效捕捉图像的全局和局部特征,在CIDEr(Consensus-based Image Description Evaluation)指标上达到了133.1%。可见基于GAT的全局图像描述生成方法能有效提高文字描述图像的准确度,从而可以使用文字对图像进行分类、检索、分析等处理。

    基于字体字符属性引导的文本图像编辑方法
    陈靖超, 徐树公, 丁友东
    2023, 43(5):  1416-1421.  DOI: 10.11772/j.issn.1001-9081.2022040520
    摘要 ( )   HTML ( )   PDF (4333KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对文本图像编辑任务中编辑前后文字风格样式不一致和生成的新文本可读性不足的问题,提出一种基于字体字符属性引导的文本图像编辑方法。首先,通过字体属性分类器结合字体分类、感知和纹理损失引导文本前景风格样式的生成方向,提升编辑前后的文字风格样式一致性;其次,通过字符属性分类器结合字符分类损失引导文字字形的准确生成,减小文本伪影与生成误差,并提升生成的新文本的可读性;最后,通过端到端微调的训练策略为整个分阶段编辑模型精炼生成结果。对比实验中,所提方法的峰值信噪比(PSNR)、结构相似度(SSIM)分别达到了25.48 dB、0.842,相较于SRNet (Style Retention Network)和SwapText分别提高了2.57 dB、0.055和2.11 dB、0.046;均方误差(MSE)为0.004 3,相较于SRNet和SwapText分别降低了0.003 1和0.002 4。实验结果表明,所提方法能有效提升文本图像编辑的生成效果。

    多学习行为协同的知识追踪模型
    张凯, 覃正楚, 刘月, 秦心怡
    2023, 43(5):  1422-1429.  DOI: 10.11772/j.issn.1001-9081.2022091313
    摘要 ( )   HTML ( )   PDF (2411KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    知识追踪模型主要使用学习过程、学习结束和学习间隔等三类学习行为数据,但现有研究没有融合上述类型的学习行为,无法准确描述多种类型学习行为的相互作用。针对上述问题,提出多学习行为协同的知识追踪(MLB-KT)模型。首先采用多头注意力机制描述每类学习行为的同类约束性,然后采用通道注意力机制建模三类学习行为的多类协同性。将MLB-KT模型与深度知识追踪(DKT)、融合注意力机制的时间卷积知识追踪(ATCKT)模型在3个数据集上进行对比,实验结果表明,MLB-KT模型的曲线下面积(AUC)有明显增加,且在ASSISTments2017数据集上的表现最佳,与DKT、ATCKT模型相比分别提升了12.26%、2.77%;表示质量对比实验的结果也表明MLB-KT模型具有更好的表现。可见建模同类约束性和多类协同性能更好地判断学生的知识状态、预测学生未来的答题情况。

    基于槽位相关信息提取的对话状态追踪模型
    石利锋, 倪郑威
    2023, 43(5):  1430-1437.  DOI: 10.11772/j.issn.1001-9081.2022040508
    摘要 ( )   HTML ( )   PDF (1557KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    对话状态追踪(DST)是任务型对话系统中一个重要的模块,但现有的基于开放词表的DST模型没有充分利用槽位的相关信息以及数据集本身的结构信息。针对上述问题,提出基于槽位相关信息提取的DST模型SCEL-DST(SCE and LOW for Dialogue State Tracking)。首先,构建槽位相关信息提取器(SCE),利用注意力机制学习槽位之间的相关信息;然后,在训练过程中应用学习最优样本权重(LOW)策略,在未大幅增加训练时间的前提下,加强模型对数据集信息的利用;最后,优化模型细节,搭建完整的SCEL-DST模型。实验结果表明,SCE和LOW对SCEL-DST模型性能的提升至关重要,该模型在两个实验数据集上均取得了更高的联合目标准确率,其中在MultiWOZ 2.3 (Wizard-of-OZ 2.3)数据集上与相同条件下的TripPy(Triple coPy)相比提升了1.6个百分点,在WOZ 2.0 (Wizard-of-OZ 2.0)数据集上与AG-DST (Amendable Generation for Dialogue State Tracking)相比提升了2.0个百分点。

    基于上下文语义增强的实体关系联合抽取
    雷景生, 剌凯俊, 杨胜英, 吴怡
    2023, 43(5):  1438-1444.  DOI: 10.11772/j.issn.1001-9081.2022040625
    摘要 ( )   HTML ( )   PDF (1612KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    基于span的联合抽取模型在实体和关系抽取(RE)任务中共享实体span的语义表示,能有效降低流水线模型带来的级联误差,但现有模型无法充分地将上下文信息融入实体和关系的表示中。针对上述问题,提出一个基于上下文语义增强的实体关系联合抽取(JERCE)模型。首先通过对比学习的方法获取句子级文本和实体间文本的语义特征表示;然后,将该表示加入实体和关系的表示中,对实体关系进行联合预测;最后,动态调整两个任务的损失以使联合模型的整体性能最优化。在公共数据集CoNLL04、ADE和ACE05上进行实验,结果显示JERCE模型与触发器感知记忆流框架(TriMF)相比,实体识别F1值分别提升了1.04、0.13和2.12个百分点,RE的F1值则分别提升了1.19、1.14和0.44个百分点。实验结果表明,JERCE模型可以充分获取上下文中的语义信息。

    融合自举与语义角色标注的威胁情报实体关系抽取方法
    程顺航, 李志华, 魏涛
    2023, 43(5):  1445-1453.  DOI: 10.11772/j.issn.1001-9081.2022040551
    摘要 ( )   HTML ( )   PDF (1678KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为高效地自动挖掘开源异构大数据中的威胁情报实体和关系,提出一种威胁情报实体关系抽取(TIERE)方法。首先,通过分析开源网络安全报告的特点,研究并提出一种数据预处理方法;然后,针对网络安全领域文本复杂度高、标准数据样本集少的问题,提出基于改进自举法的命名实体识别(NER-IBS)算法和基于语义角色标注的关系抽取(RE-SRL)算法。利用少量样本和规则构建初始种子,通过迭代训练挖掘非结构化文本中的实体,并通过构建语义角色的策略挖掘实体之间的关系。实验结果表明,在少样本网络安全信息抽取数据集上,NER-IBS算法的F1值为84%,与RDF-CRF (Regular expression and Dictionary combined with Feature templates as well as Conditional Random Field)算法相比提高了2个百分点,且RE-SRL算法对于无类别关系抽取的F1值为94%,说明TIERE方法具有高效的实体关系抽取能力。

    面向方面的自适应跨度特征的细粒度意见元组提取
    陈林颖, 刘建华, 孙水华, 郑智雄, 林鸿辉, 林杰
    2023, 43(5):  1454-1460.  DOI: 10.11772/j.issn.1001-9081.2022040502
    摘要 ( )   HTML ( )   PDF (1182KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    面向方面的细粒度意见提取(AFOE)以意见对的形式从评论中提取方面词和意见词,或在此基础上再提取方面词的情感极性形成意见三元组。针对现有研究方法忽略了意见对与上下文相关性的问题,提出一种面向方面的自适应跨度特征的网格标记方案(ASF-GTS)模型。首先,利用BERT(Bidirectional Encode Representation from Transformers)模型获得句子的特征表示;然后,采用自适应跨度特征(ASF)方法加强意见对与局部上下文的联系;其次,通过网格标记方案(GTS)将意见对提取(OPE)转化为统一的网格标记任务;最后,使用特定的解码策略生成对应的意见对或意见三元组。在适用于意见元组提取任务的四个AFOE基准数据集上进行实验,结果表明,与GTS-BERT(Grid Tagging Scheme-BERT)模型相比,所提模型在意见对和意见三元组任务上的F1值分别提高了2.42%~7.30%和2.62%~6.61%。所提模型能够有效保留意见对与上下文的情感联系,更精确地提取意见对及其情感极性。

    基于ERNIE+DPCNN+BiGRU的农业新闻文本分类
    杨森淇, 段旭良, 肖展, 郎松松, 李志勇
    2023, 43(5):  1461-1466.  DOI: 10.11772/j.issn.1001-9081.2022040641
    摘要 ( )   HTML ( )   PDF (1813KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对农业新闻目前面临的针对性差、分类不清和数据集缺乏等问题,提出一种基于ERNIE(Enhanced Representation through kNowledge IntEgration)、深度金字塔卷积神经网络(DPCNN)和双向门控循环单元(BiGRU)的农业新闻分类模型——EGC。首先利用ERNIE对数据集进行编码,然后利用改进后的DPCNN和BiGRU同时提取新闻文本的特征,再将两者提取的特征进行拼合并经过Softmax得到最终结果。为了使EGC模型适用于农业新闻分类领域,对DPCNN进行改进,减少它的卷积层以保留更多特征。实验结果表明,与ERNIE相比,EGC模型的精确率、召回率和F1分数别提升了1.47、1.29和1.42个百分点,优于传统分类模型。

    数据科学与技术
    基于相似和差异双视角的高维数据属性约简
    李元江, 权金升, 谭阳奕, 杨田
    2023, 43(5):  1467-1472.  DOI: 10.11772/j.issn.1001-9081.2022081154
    摘要 ( )   HTML ( )   PDF (464KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对数据维度过高、冗余信息过多导致维度灾难的问题,提出一种基于异同矩阵的高维属性约简算法(ARSDM)。该算法在区分矩阵的基础上加入对同类样本的相似度衡量,形成对所有样本的综合评估。首先,计算样本在每个属性下的距离,并基于这些距离得到同类相似度和异类差异度;其次,建立异同矩阵,形成对整个数据集的评价;最后,进行属性约简,即将异同矩阵的每一列求和,依次选择值最大的特征进行约简,并将相应样本对的行向量置为零向量。实验结果表明,与经典属性约简算法DMG(Discernibility Matrix based on Graph theory)、FFRS(Fitting Fuzzy Rough Sets)以及GBNRS(Granular Ball Neighborhood Rough Sets)相比,在分类回归树(CART)分类器下,ARSDM的平均分类准确率分别提高了1.07、6.48、8.92个百分点;在支持向量机(SVM)分类器下,ARSDM的平均分类准确率分别提高了1.96、11.96、12.39个百分点;运行效率上ARSDM优于GBNRS和FFRS。可见,ARSDM能够有效去除冗余信息,提高分类准确率。

    基于长度约束的蝙蝠高效用项集挖掘算法
    袁泉, 唐成亮, 徐雲鹏
    2023, 43(5):  1473-1480.  DOI: 10.11772/j.issn.1001-9081.2022040622
    摘要 ( )   HTML ( )   PDF (1493KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为了挖掘满足用户特殊需求,如含指定项目数量的高效用项集(HUI),提出一种基于长度约束的蝙蝠高效用项集挖掘算法(HUIM-LC-BA)。该算法融合蝙蝠算法(BA)和长度约束构建高效用项集挖掘(HUIM)模型,首先将数据库转换为位图矩阵,实现高效的效用计算和数据库扫描;其次,采用重新定义的事务加权效用(RTWU)策略缩减搜索空间;最后,对项集进行长度修剪,使用深度优先搜索和轮盘赌注选择法确定修剪项目。在4个数据集的仿真实验中,当最大长度为6时,与HUIM-BA相比,HUIM-LC-BA挖掘的模式数量分别减少了91%、98%、99%与97%,同时运行时间也少于HUIM-BA;且在不同长度约束条件下,与FHM+ (Faster High-utility itemset Ming plus)算法相比运行时间更稳定。实验结果表明,HUIM-LC-BA能有效挖掘具有长度约束的HUI,并减少挖掘模式的数量。

    基于Seeds集和成对约束的半监督三支聚类集成
    姜春茂, 吴鹏, 李志聪
    2023, 43(5):  1481-1488.  DOI: 10.11772/j.issn.1001-9081.2022071094
    摘要 ( )   HTML ( )   PDF (1442KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    聚类集成使用合适的策略融合多个具有差异性的基聚类成员,能够有效提高聚类结果的稳定性、鲁棒性和准确率。当前聚类集成的研究较少利用已知的先验信息,面对复杂数据时难以刻画对象与类簇之间明确的归属关系。因此,提出一种基于Seeds集和成对约束的半监督三支聚类集成方法。首先,基于已有的标签信息提出一种新的三支标签传播算法构造基聚类成员;其次,提出一种半监督三支聚类集成框架集成基聚类成员,构造出一致性相似矩阵,并利用成对约束信息对该矩阵进行优化调整;最后,将三支谱聚类作为一致性函数对相似矩阵进行聚类,得到最终集成结果。在多个UCI真实数据集上的实验结果表明,与基于类簇的相似分区算法(CSPA)、超图分区算法(HGPA)、元类簇算法(MCLA)、标签传播算法(LPA)、Cop-Kmeans等半监督聚类集成算法相比,所提方法的归一化互信息(NMI)、调整兰德系数(ARI)和F测度在绝大多数据集上取得了最优值,获得了相对更好的聚类集成结果。

    基于节点多关系的社团挖掘算法及其应用
    周琳, 肖玉芝, 刘鹏, 秦有鹏
    2023, 43(5):  1489-1496.  DOI: 10.11772/j.issn.1001-9081.2022081218
    摘要 ( )   HTML ( )   PDF (4478KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为度量多关系节点相似性、挖掘具有多关系节点的社团结构,提出基于节点多关系的社团挖掘算法LSL-GN。首先基于节点相似性和节点可达性刻画具有多关系的节点相似性度量指标LHN-ISL;然后利用该指标重构目标网络的低密度模型,并结合GN(Girvan-Newman)算法完成社团划分。将LSL-GN算法与多个经典社团挖掘算法在模块度(Q)、标准化互信息(NMI)和调整兰德指数(ARI)上进行对比,结果显示LSL-GN算法在3个指标上均优于经典算法,说明它的社团划分质量相对较好。将LSL-GN应用于“用户-应用”的移动漫游网络模型中,划分出了以携程旅行、高德地图、滴滴出行等为基础应用的社团结构,而这些社团划分结果可为设计个性化套餐业务提供策略参考信息。

    网络空间安全
    基于不同敏感度的改进K-匿名隐私保护算法
    翟冉, 陈学斌, 张国鹏, 裴浪涛, 马征
    2023, 43(5):  1497-1503.  DOI: 10.11772/j.issn.1001-9081.2022040552
    摘要 ( )   HTML ( )   PDF (1192KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对机器学习的发展需要大量兼顾数据安全性和可用性的真实数据集的问题,提出一种基于随机森林(RF)的K-匿名隐私保护算法——RFK-匿名隐私保护。首先,使用RF算法预测出每种属性值的敏感程度;然后,使用k-means聚类算法将属性值根据不同敏感程度进行聚类,再使用K-匿名算法根据属性值的敏感程度集群对数据进行不同程度的隐匿;最后,由用户自主地选择需要哪种隐匿程度的数据表。实验结果表明,在Adult数据集中,与K-匿名算法处理过的数据相比,RFK-匿名隐私保护算法处理过的数据在阈值分别为3、4时的准确率分别提高了0.5、1.6个百分点;与(pαk)-匿名算法处理过的数据相比,RFK-匿名隐私保护算法处理过的数据在阈值分别为4、5时的准确率分别提高了0.4、1.9个百分点。RFK-匿名隐私保护算法在保护数据的隐私安全的基础上能有效提高数据的可用性,更适合应用于机器学习中的分类预测。

    基于混合整数线性规划模型的SPONGENT S盒紧凑约束分析
    石一鹏, 刘杰, 祖锦源, 张涛, 张国群
    2023, 43(5):  1504-1510.  DOI: 10.11772/j.issn.1001-9081.2022040496
    摘要 ( )   HTML ( )   PDF (503KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    应用基于混合整数线性规划(MILP)模型的S盒紧凑约束计算方法,可以较好地解决SPONGENT在差分密码分析过程中差分路径搜索效率低下的问题;为寻找S盒的最优描述,提出一种紧凑性验证算法从约束条件存在必要性的角度验证S盒的不等式约束的紧凑性问题。首先,引入MILP模型分析SPONGENT S盒的不等式约束,得到了由23个不等式组成的约束;然后,提出一种用于评价约束不等式存在必要性的指标,并基于该指标提出了一种验证约束不等式组紧凑程度的紧凑性验证算法;最后,使用所提算法验证所求得的SPONGENT S盒约束的紧凑性。计算分析表明,23个不等式都具有唯一可以排除的不可能差分模式,即每个不等式都有存在的必要性;同时,对于同一案例,与利用贪心算法原理筛选的不等式相比,数量减少了20%。因此,所得到的SPONGENT的S盒不等式约束是紧凑的,且所提紧凑性验证算法的效果要优于对比的贪心算法。

    改进的基于奇异值分解的图卷积网络防御方法
    金柯君, 于洪涛, 吴翼腾, 李邵梅, 张建朋, 郑洪浩
    2023, 43(5):  1511-1517.  DOI: 10.11772/j.issn.1001-9081.2022040553
    摘要 ( )   HTML ( )   PDF (760KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    图神经网络(GNN)容易受到对抗性攻击而导致性能下降,影响节点分类、链路预测和社区检测等下游任务,因此GNN的防御方法具有重要研究价值。针对GNN在面对对抗性攻击时鲁棒性差的问题,以图卷积网络(GCN)为模型,提出一种改进的基于奇异值分解(SVD)的投毒攻击防御方法ISVDatt。在投毒攻击场景下,该方法可对扰动图进行净化处理。GCN遭受投毒攻击后,首先筛选并删除特征差异较大的连边使图保持特征光滑性;然后进行SVD和低秩近似操作使扰动图保持低秩性,并完成对它的净化处理;最后将净化后的扰动图用于GCN模型训练,从而实现对投毒攻击的有效防御。在开源的Citeseer、Cora和Pubmed数据集上针对Metattack和DICE(Delete Internally, Connect Externally)攻击进行实验,并与基于SVD、Pro_GNN和鲁棒图卷积网络(RGCN)的防御方法进行了对比,结果显示ISVDatt的防御效果相对较优,虽然分类准确率比Pro_GNN低,但复杂度低,时间开销可以忽略不计。实验结果表明ISVDatt能有效抵御投毒攻击,兼顾算法的复杂度和通用性,具有较高的实用价值。

    基于区块链的医疗数据分级访问控制与共享系统
    曹萌, 余孙婕, 曾辉, 史红周
    2023, 43(5):  1518-1526.  DOI: 10.11772/j.issn.1001-9081.2022050733
    摘要 ( )   HTML ( )   PDF (2871KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对当前医疗数据共享时访问控制粒度过粗、共享灵活性低、集中式医疗数据共享平台存在数据泄露的安全隐患等问题,提出一种基于区块链的医疗数据分级访问控制与共享系统。首先,对医疗数据按照敏感度分级,并提出了密文策略属性基分级加密(CP-ABHE)算法,实现对不同敏感度医疗数据的访问控制。该算法使用合并访问控制树和结合对称加密方法提升密文策略属性基加密(CP-ABE)算法的性能,并使用多授权中心解决密钥托管问题。然后,采用基于许可区块链的医疗数据共享模式解决集中式共享平台存在的中心化信任问题。安全性分析结果表明,所提系统在数据共享过程中保证了数据的安全性,可以抵御用户合谋攻击和权威合谋攻击。实验结果表明,CP-ABHE算法拥有比CP-ABE算法更低的计算开销,所提系统的最大平均时延为7.8 s,最高吞吐量为每秒处理236个事务,符合预期性能要求。

    基于深度可分离卷积的多神经网络恶意代码检测模型
    蒋瑞林, 覃仁超
    2023, 43(5):  1527-1533.  DOI: 10.11772/j.issn.1001-9081.2022050716
    摘要 ( )   HTML ( )   PDF (2771KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对传统的恶意代码检测方法存在成本过高和检测结果不稳定等问题,提出一种基于深度可分离卷积的多神经网络恶意代码检测模型。该模型使用深度可分离卷积(DSC)、SENet(Squeeze-and-Excitation Network)通道注意力机制和灰度共生矩阵(GLCM),通过三个轻型神经网络与灰度图像纹理特征分类并联检测恶意代码家族及其变种,将多个强分类器检测结果通过朴素贝叶斯分类器融合,在提高检测准确率的同时减少网络计算开销。在MalVis+良性数据的混合数据集上的实验结果表明,该模型对恶意代码家族及其变种的检测准确率达到97.43%,相较于ResNet50、VGGNet模型分别提高了6.19和2.29个百分点,而它的参数量只有ResNet50模型的68%和VGGNet模型的13%;在malimg数据集上该模型的检测准确率达到99.31%。可见,所提模型检测效果较好,且参数量也有所降低。

    基于ECA规则和动态污点分析的SQL注入攻击在线检测
    刘吉会, 何成万
    2023, 43(5):  1534-1542.  DOI: 10.11772/j.issn.1001-9081.2022040636
    摘要 ( )   HTML ( )   PDF (2389KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    SQL注入攻击是一种常见的针对Web应用程序漏洞的攻击形式。任何形式的SQL注入攻击最终都会改变原有SQL语句的逻辑结构,违背设计者的初衷。现有的SQL注入攻击检测方法存在检测代码不易被重用、不能被在线注入Web应用程序等不足。因此,提出一种基于ECA(Event Condition Action)规则和动态污点分析的在线检测SQL注入攻击的模型。首先,定义污点标记规则监视污点源函数以标记系统外部引入数据;然后,定义污点传播规则实时跟踪污点数据在应用内部的流向;接着,定义污点检查规则以拦截污点汇聚点函数的参数,并解析它可能携带的污点状态;最后,在原始的Web应用运行时加载ECA规则脚本达到在线检测SQL注入攻击的目的,Web应用无须重新编译、打包和部署。使用Byteman实现了所提模型。在两个不同的Web应用测试实验中,该模型可以识别绝大多数的SQL注入攻击样本,对于正常请求样本没有误报,检测准确率可达99.42%,优于基于支持向量机(SVM)和基于词频逆向文件频率(TF-IDF)的方法;与基于面向方面编程(AOP)的方法相比,该模型易于在Web应用启动后在线加载检测模块。实验结果表明所提模型能够在不修改应用程序执行引擎及源码的情况下,检测6种常见的SQL注入攻击类型,且具有在线检测的优点。

    先进计算
    基于改进深度强化学习的边缘计算服务卸载算法
    曹腾飞, 刘延亮, 王晓英
    2023, 43(5):  1543-1550.  DOI: 10.11772/j.issn.1001-9081.2022050724
    摘要 ( )   HTML ( )   PDF (2400KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在边缘计算(EC)网络中,针对边缘节点计算资源和存储空间有限的问题,提出一种基于改进深度强化学习(DRL)的边缘计算服务卸载(ECSO)算法,以降低节点处理时延和提高服务性能。具体来说,将边缘节点服务卸载问题转化为资源受限的马尔可夫决策过程(MDP),利用DRL算法解决边缘节点的请求状态转移概率难以精确预测的问题;考虑到边缘节点执行缓存服务的状态动作空间过大,定义新的动作行为替代原有动作,并依据提出的动作筛选算法得到最优动作集合,以改进计算动作行为奖励值的过程,进而大幅度降低动作空间大小,提高算法训练的效率以及收益。仿真实验结果表明,对比原深度Q网络(DQN)算法、邻近策略优化(PPO)算法以及传统的最流行(MP)算法,ECSO算法的总奖励值分别提升了7.0%、12.7%和65.6%,边缘节点服务卸载时延分别降低了13.0%、18.8%和66.4%,验证了算法的有效性,说明ECSO能有效提升边缘计算服务的卸载性能。

    改进自组织映射的多无人机协同任务分配方法
    孙亚男, 吴杰宏, 石峻岭, 高利军
    2023, 43(5):  1551-1556.  DOI: 10.11772/j.issn.1001-9081.2022040592
    摘要 ( )   HTML ( )   PDF (2598KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有算法对多无人机(UAV)协同进行多任务分配时存在负载均衡和执行效率方面的不足,提出一种改进的自组织映射(ISOM)算法。该算法根据飞行时间和任务执行时间设计了UAV的负载均衡度,以提升任务完成的效率;还设计了新的非线性变化的学习率和邻域函数保证ISOM算法的稳定性和快速收敛。然后,在不同任务环境对ISOM算法进行了有效性验证。实验结果表明,与结合遗传算法的粒子群优化(GA-PSO)、Gurobi和ORTools算法相比,ISOM算法的任务完成时间可分别减少15.5%、12.7%和7.3%;在TSPLIB数据集的实例KroA100、KroA150、KroA200上进行航迹长度减小的有效性验证时,与杂草优化(IWO)算法、改进的单亲遗传算法(IPGA)和蚁群单亲遗传算法(AC-PGA)的对比结果表明,ISOM算法在无人机数量为2、3、4、5、8时,均获得了最小的航迹长度。由此可见,ISOM算法在解决多UAV协同多任务分配问题时效果显著。

    多媒体计算与计算机仿真
    基于注意力机制和上下文信息的目标检测算法
    刘辉, 张琳玉, 王复港, 何如瑾
    2023, 43(5):  1557-1564.  DOI: 10.11772/j.issn.1001-9081.2022040554
    摘要 ( )   HTML ( )   PDF (3014KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对目标检测过程中存在的小目标漏检问题,提出一种基于注意力机制和多尺度上下文信息的改进YOLOv5目标检测算法。首先,在特征提取结构中加入多尺度空洞可分离卷积模块(MDSCM)以提取多尺度特征信息,在增大感受野的同时避免小目标信息的丢失;其次,在主干网络中添加注意力机制,并在通道信息中嵌入位置感知信息,进一步增强算法的特征表达能力;最后,使用Soft-NMS(Soft-Non-Maximum Suppression)代替YOLOv5使用的非极大值抑制(NMS),降低检测算法的漏检率。实验结果表明,改进算法在PASCAL VOC数据集、DOTA航拍数据集和DIOR光学遥感数据集上的检测精度分别达到了82.80%、71.74%和77.11%,相较于YOLOv5,分别提高了3.70、1.49和2.48个百分点;而且它对图像中小目标的检测效果更好。因此,改进的YOLOv5可以更好地应用到小目标检测场景中。

    基于状态精细化长短期记忆和注意力机制的社交生成对抗网络用于行人轨迹预测
    吴家皋, 章仕稳, 蒋宇栋, 刘林峰
    2023, 43(5):  1565-1570.  DOI: 10.11772/j.issn.1001-9081.2022040602
    摘要 ( )   HTML ( )   PDF (1387KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对当前行人轨迹预测研究仅考虑影响行人交互因素的问题,基于状态精细化长短期记忆(SR-LSTM)和注意力机制提出一种用于行人轨迹预测的社交生成对抗网络(SRA-SIGAN)模型,利用生成对抗网络(GAN)学习获得目标行人的运动规律。首先,使用SR-LSTM作为位置编码器提取运动意图信息;其次,通过设置速度注意力机制合理地为同一场景中的行人分配影响力,以更好地处理行人的交互;最后,由解码器生成预测的未来轨迹。在多个公开数据集上的测试实验结果表明,SRA-SIGAN模型的总体表现良好。特别是在Zara1数据集上,与SR-LSTM模型相比,SRA-SIGAN模型的平均位移误差(ADE)和最终位移误差(FDE)分别减小了20.0%和10.5%;与社交生成对抗网络(SIGAN)模型相比,SRA-SIGAN的ADE和FDE分别下降了31.7%和24.4%。

    基于重构误差的无监督人脸伪造视频检测
    许喆, 王志宏, 单存宇, 孙亚茹, 杨莹
    2023, 43(5):  1571-1577.  DOI: 10.11772/j.issn.1001-9081.2022040568
    摘要 ( )   HTML ( )   PDF (1205KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    目前有监督的人脸伪造视频检测方法需要大量标注数据。为解决视频伪造方法迭代快、种类多等现实问题,将时序异常检测中的无监督思想引入人脸伪造视频检测,将伪造视频检测任务转为无监督的视频异常检测任务,提出一种基于重构误差的无监督人脸伪造视频检测模型。首先,抽取待检测视频中连续帧的人脸特征点序列;其次,基于偏移特征、局部特征、时序特征等多粒度信息对待检测视频中人脸特征点序列进行重构;然后,计算原始序列与重构序列之间的重构误差;最后,根据重构误差的波峰频率计算得分对伪造视频进行自动检测。实验结果表明,在FaceShifter、FaceSwap等人脸视频伪造方法上,与LRNet (Landmark Recurrent Network)、Xception-c23等检测方法相比,所提方法的检测性能的曲线下方面积(AUC)最多增加了27.6%,移植性能的AUC最多增加了30.4%。

    基于多峰标签分布学习的多任务年龄估计方法
    何建辉, 胡春龙, 束鑫
    2023, 43(5):  1578-1583.  DOI: 10.11772/j.issn.1001-9081.2022040606
    摘要 ( )   HTML ( )   PDF (1036KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对面部年龄估计中标签序数信息和类间相关性提取难的问题,提出一种多峰分布(MPD)年龄编码,并基于该年龄编码构建了一个多任务年龄估计方法MPDNet(MPD Network)。首先,利用MPD将年龄标签转化为年龄分布,以提取年龄标签间的相关信息,构建年龄老化趋势的阶段性;然后,采用一个轻量级网络进行多阶段的特征提取,并对提取的特征分别进行标签分布学习(LDL)和回归学习;最后,共享两个学习任务的输出,并在训练过程中通过反向传播互相优化,避免传统标签分布学习中对分布结果直接进行回归导致的误差传播。在MORPH Ⅱ数据集上的实验结果表明,MPDNet的平均绝对误差(MAE)达到2.67,与基于VGGNets (Visual Geometry Group Networks)构建的DEX(Deep EXpectation)、RankingCNN (Ranking Convolutional Neural Network)等方法相当,而参数仅为VGGNets的1/788.6;而且MPDNet也优于同体量的C3AE(extremely Compact yet efficient Cascade Context-based Age Estimation model)、SSR-Net (Soft Stagewise Regression Network)等方法。MPDNet能够较好地利用年龄标签间丰富的相关信息来提取更具判别力的年龄特征,提高年龄估计任务的预测精度。

    基于Transformer的U型医学图像分割网络综述
    傅励瑶, 尹梦晓, 杨锋
    2023, 43(5):  1584-1595.  DOI: 10.11772/j.issn.1001-9081.2022040530
    摘要 ( )   HTML ( )   PDF (1887KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    目前,医学图像分割模型广泛采用基于全卷积网络(FCN)的U型网络(U-Net)作为骨干网,但卷积神经网络(CNN)在捕捉长距离依赖能力上的劣势限制了分割模型性能的进一步提升。针对上述问题,研究者们将Transformer应用到医学图像分割模型中以弥补CNN的不足,结合Transformer和U型结构的分割网络成为研究热点之一。在详细介绍U-Net和Transformer之后,按医学图像分割模型中Transformer模块所处的位置,包括仅在编码器或解码器、同时在编码器和解码器、作为过渡连接和其他位置进行分类,讨论各模型的基本内容、设计理念以及可改进的地方,并分析了Transformer处于不同位置的优缺点。根据分析结果可知,决定Transformer所在位置的最大因素是目标分割任务的特点,而且Transformer结合U-Net的分割模型能更好地利用CNN和Transformer各自的优势,提高模型的分割性能,具有较大的发展前景和研究价值。

    基于Transformer的结构强化IVOCT导丝伪影去除方法
    郭劲文, 马兴华, 骆功宁, 王玮, 曹阳, 王宽全
    2023, 43(5):  1596-1605.  DOI: 10.11772/j.issn.1001-9081.2022040536
    摘要 ( )   HTML ( )   PDF (4010KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为去除导丝伪影以提高血管内光学相干断层扫描(IVOCT)的图像质量,辅助医师更加准确地诊断心血管疾病,降低误诊及漏诊的概率,针对IVOCT图像结构信息复杂且伪影区域占比大的难点,提出一种采用生成对抗网络(GAN)架构的基于Transformer的结构强化网络(SETN)。首先,GAN的生成器在提取纹理特征的原始图像(ORI)主干生成网络的基础上,并联了RTV(Relative Total Variation)图像强化生成网络用于获取图像的结构信息;其次,在ORI/RTV图像的伪影区域重建过程中,引入了分别关注时/空间域信息的Transformer编码器,用于捕获IVOCT图像序列的上下文信息以及纹理/结构特征之间的关联性;最后,利用结构特征融合模块将不同层次的结构特征融入ORI主干生成网络的解码阶段,配合判别器完成导丝伪影区域的图像重建。实验结果表明,SETN的导丝伪影去除结果在纹理和结构的重建上均十分优秀。此外,导丝伪影去除后IVOCT图像质量的提高,对于IVOCT图像的易损斑块分割及管腔轮廓线提取任务均具有积极意义。

    基于自注意力连接UNet的磁共振成像去吉布斯伪影算法
    刘阳, 陆志扬, 王骏, 施俊
    2023, 43(5):  1606-1611.  DOI: 10.11772/j.issn.1001-9081.2022040618
    摘要 ( )   HTML ( )   PDF (1363KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为去除磁共振成像(MRI)中的吉布斯伪影,提出一种基于自蒸馏训练的自注意力连接UNet (SD-SacUNet)算法。为了缩小UNet框架中跳连接两端编码和解码特征之间的语义差距,帮助捕捉伪影的位置信息,将UNet编码端每个下采样层的输出特征分别输入各自的自注意力连接模块进行自注意力机制的运算,而后与解码特征进行融合,参与特征的重建;在网络解码端进行自蒸馏训练,通过建立深层与浅层特征之间的损失函数,使深层重建网络的特征信息可以用于指导浅层网络的训练,同时优化整个网络,提升图像重建水平。在公开的MRI数据集CC359上评估SD-SacUNet算法的性能,获得的峰值信噪比(PSNR)为30.26 dB,结构相似性(SSIM)为0.917 9;与GRACNN (Gibbs-Ringing Artifact reduction using Convolutional Neural Network)、SwinIR (Image Restoration using Swin Transformer)相比,SD-SacUNet的PSNR分别提高了0.77 dB、0.14 dB,SSIM分别提高了0.018 3、0.003 3。实验结果表明,SD-SacUNet算法提升了MRI去除吉布斯伪影的图像重建性能,具备潜在的应用价值。

    基于特征金字塔网络和密集网络的肺部CT图像超分辨率重建
    申利华, 李波
    2023, 43(5):  1612-1619.  DOI: 10.11772/j.issn.1001-9081.2022040620
    摘要 ( )   HTML ( )   PDF (4504KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对肺部计算机断层扫描(CT)图像的超分辨率(SR)重建中需要加大对肺结节的关注度、满足重建后的特征具有客观存在性等问题,提出一种基于特征金字塔网络(FPN)和密集网络的肺部图像SR重建方法。首先,在特征提取层利用FPN提取特征;其次,在特征映射层设计基于残差网络的局部结构,再用特殊的密集网络连接此类局部结构;再次,在特征重建层利用卷积神经网络(CNN)将不同深度的卷积层逐渐降为图像大小;最后,利用残差网络融合初始低分辨率(LR)特征与重建的高分辨率(HR)特征,形成最终的SR图像。对比实验显示,FPN中2次特征融合和特征映射中5个局部结构连接的深度学习网络效果更佳。所提出的网络相较于超分辨率卷积神经网络(SRCNN)等经典网络重建SR图像的峰值信噪比(PSNR)更高,并且可以获得更好的视觉质量。

    前沿与综合应用
    基于共享注意力的多智能体强化学习订单派送
    黄晓辉, 杨凯铭, 凌嘉壕
    2023, 43(5):  1620-1624.  DOI: 10.11772/j.issn.1001-9081.2022040630
    摘要 ( )   HTML ( )   PDF (1392KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    网约车因方便、快捷成为现今人们出行热门之选,如何更高效地派送合适的订单将乘客送到目的地是如今研究的热点。许多研究着重于训练单智能体,再由它统一分配订单,车辆本身并不参与决策。针对以上问题,提出一种基于共享注意力的多智能体强化学习(SARL)算法。该算法将订单派送问题建模为一个马尔可夫决策过程,运用多智能体强化学习,通过集中训练、分散执行的方式让每个智能体均成为决策者;同时加入共享注意力机制,让智能体彼此共享信息并合作。最后,在不同尺度地图、不同乘客数以及不同车辆数情形下与完全随机匹配(Random)、贪婪算法(Greedy)、多智能体强化学习算法IDQN和混合Q值网络(QMIX)进行对比。结果显示,在固定和可变的车辆与乘客组合情况下,SARL算法在三个不同尺度地图(100×100、10×10和500×500)的时间效率均达到了最优,验证了算法的泛化性能和稳定性。SARL算法可以优化车辆和乘客的配对,减少乘客等待时间,提升乘客满意度。

    基于多任务联合学习的跨视角地理定位方法
    王先兰, 周金坤, 穆楠, 王晨
    2023, 43(5):  1625-1635.  DOI: 10.11772/j.issn.1001-9081.2022040541
    摘要 ( )   HTML ( )   PDF (3631KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有跨视角地理定位方法中视点不变特征与视角转换方法割裂导致的性能提升瓶颈问题,提出多任务联合学习模型(MJLM)。MJLM由前置图像生成模型和后置图像检索模型组成。前置生成模型首先使用逆透视映射(IPM)进行坐标变换,显式地弥合空间域差,使投影图像与真实卫星图的空间几何特征大致相同;然后通过提出的跨视角生成对抗网络(CVGAN)隐式地对图像内容及纹理进行细粒度的匹配和修复,并合成出更平滑且真实的卫星图像。后置检索模型由多视角多监督网络(MMNet)构成,能够兼顾多尺度特征和多监督学习的图像检索任务。在University-1652(无人机定位数据集)上进行实验,结果显示MJLM对无人机(UAV)定位任务的平均精确率(AP)及召回率(R@1)分别达到89.22%和87.54%,与LPN (Local Pattern Network)和MSBA (MultiScale Block Attention)相比,MJLM在R@1上分别提升了15.29%和1.07%。可见,MJLM能在一个聚合框架体系内联合处理跨视角图像生成任务及检索任务,实现基于视角转换与视点不变特征方法的融合,有效提升跨视角地理定位的精度和鲁棒性,验证UAV定位的可行性。

    基于CSI和K-means-SVR的多指纹库室内定位方法
    王逸, 裴生雷, 王煜
    2023, 43(5):  1636-1640.  DOI: 10.11772/j.issn.1001-9081.2022081162
    摘要 ( )   HTML ( )   PDF (1618KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    传统的Wi-Fi室内定位方法需要与所有指纹数据库中的指纹数据进行匹配后才能定位,导致人群聚集区域定位效率不高,体验较差。提出一种基于信道状态信息(CSI)、K均值(K-means)聚类算法与支持向量回归(SVR)算法相结合的多指纹库室内定位方法。该方法首先根据CSI的簇分布特点,利用K-means算法对所有定位点内的CSI数据聚类后得到多个簇的CSI数据;然后,基于多个簇分别建立多个指纹库,并将CSI数据分别存入多个指纹库,进而在每个指纹库中分别训练SVR模型用于Wi-Fi定位。相较于传统的支持向量机(SVM)定位方法,所提方法在离线阶段需要的训练样本更少,定位效率更高;在线阶段,该方法既降低了匹配的复杂度,也提高了定位的精度。由于使用了多指纹库,Wi-Fi定位系统可以根据人流量实时调整资源分配策略,提高服务器运行效率和定位服务体验。

    基于事件触发机制的神经网络同步控制
    葛超, 常晨蕾, 姚征, 苏皓
    2023, 43(5):  1641-1646.  DOI: 10.11772/j.issn.1001-9081.2022040588
    摘要 ( )   HTML ( )   PDF (1542KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    对于混合时滞神经网络同步控制中控制器存在随机摄动的问题,提出一种基于事件触发机制的非脆弱控制器。首先,使用一个服从伯努利分布的随机变量描述控制器增益摄动存在的随机性;其次,在神经网络同步控制过程中引入事件触发机制;接着,构造一个新颖的双边李雅普诺夫函数,充分考虑系统状态信息,同时利用改进的积分不等式对泛函导数进行放缩,得到同步误差系统指数稳定性的充分条件;最后,基于解耦技术设计了非脆弱控制器。通过仿真实例验证了所提控制器的有效性。实验结果表明,在四罐系统中,在相同采样周期下,与现有的指数衰减系数相比,所提控制器获得的指数衰减系数提升了0.16。

    结合注意力机制与深度强化学习的超短期光伏功率预测
    丁正凯, 傅启明, 陈建平, 陆悠, 吴宏杰, 方能炜, 邢镔
    2023, 43(5):  1647-1654.  DOI: 10.11772/j.issn.1001-9081.2022040542
    摘要 ( )   HTML ( )   PDF (3448KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对传统光伏(PV)功率预测模型受功率随机波动性影响以及易忽略重要信息导致预测精度低的问题,将注意力机制分别与深度确定性策略梯度(DDPG)和循环确定性策略梯度(RDPG)相结合提出了ADDPG和ARDPG模型,并在此基础上提出一个PV功率预测框架。首先,将原始PV功率数据以及气象数据标准化,并将PV功率预测问题建模为马尔可夫决策过程(MDP),历史功率数据和当前气象数据则作为MDP的状态;然后,将注意力机制加入DDPG和RDPG的Actor网络,赋予状态中各个分量不同的权重来突出重要且关键的信息,并通过深度强化学习智能体和历史数据的交互来学习数据中的关键信息;最后,求解MDP问题得到最优的策略,作出准确的预测。在DKASC、Alice Springs光伏系统数据上的实验结果表明,ADDPG和ARDPG在均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)上均取得了最优结果。可见,所提模型能够有效提高PV功率的预测精度,也可以推广到其他预测领域如电网预测、风力发电预测等。

2023年 43卷 11期
刊出日期: 2023-11-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会