当期目录

    2023年 第43卷 第7期 刊出日期:2023-07-10
    第39届CCF中国数据库学术会议(NDBC 2022)
    面向动态网络的介数中心度并行算法
    刘震宇, 王朝坤, 郭高扬
    2023, 43(7):  1987-1993.  DOI: 10.11772/j.issn.1001-9081.2022071121
    摘要 ( )   HTML ( )   PDF (1663KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    介数中心度是评价图中节点重要性的一项常用指标,然而在大规模动态图中介数中心度的更新效率很难满足应用需求。随着多核技术的发展,算法并行化已成为解决该问题的有效手段之一。因此,提出一种面向动态网络的介数中心度并行算法(PAB)。首先,通过社区过滤、等距剪枝和分类筛选等操作减少了冗余点对的时间开销;然后,基于对算法确定性的分析和处理实现了并行化。在真实数据集和合成数据集上进行了对比实验,结果显示在添加边更新时PAB的更新效率为并行算法中最新的batch-iCENTRAL的4倍。可见,所提算法能够有效提高动态网络中介数中心度的更新效率。

    面向云环境密文排序检索的字典划分向量空间模型
    陆佳行, 戴华, 刘源龙, 周倩, 杨庚
    2023, 43(7):  1994-2000.  DOI: 10.11772/j.issn.1001-9081.2022071111
    摘要 ( )   HTML ( )   PDF (1846KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对传统向量空间模型(TVSM)生成的向量维度高,计算文档与检索关键词相关度的向量点积运算耗时长的问题,提出一种面向云环境密文排序检索的字典划分向量空间模型(DPVSM)。首先给出DPVSM的具体定义,并证明了DPVSM中检索关键词与文档的相关度得分与TVSM中的相关度得分完全相等;然后,采用等长字典划分方法,提出加密向量生成算法和文档与检索关键词相关度得分计算算法。实验结果表明,DPVSM文档向量的空间开销远少于TVSM,且文档数量越多开销降低越多;此外,DPVSM的检索向量的空间开销以及相关度得分计算的耗时也远低于TVSM。显然,DPVSM在生成向量的空间效率和相关度得分计算的时间效率上均优于TVSM。

    融合协同知识图谱与反事实推理的可解释推荐机制
    夏子芳, 于亚新, 王子腾, 乔佳琪
    2023, 43(7):  2001-2009.  DOI: 10.11772/j.issn.1001-9081.2022071113
    摘要 ( )   HTML ( )   PDF (1898KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    为构建透明可信的推荐机制,相关研究工作主要通过可解释推荐机制为个性化推荐提供合理解释,然而现有可解释推荐机制存在三大局限:1)利用相关关系只能提供合理化解释而非因果解释,而利用路径提供解释存在隐私泄露问题;2)忽略了用户反馈稀疏的问题,解释的保真度难以保证;3)解释粒度较粗,未考虑用户个性化偏好。为解决上述问题,提出基于协同知识图谱(CKG)与反事实推理的可解释推荐机制(ERCKCI)。首先,基于用户自身的行为序列,采用反事实推理思想利用因果关系实现高稀疏度因果去相关,并迭代推导出反事实解释;其次,为提升解释保真度,不仅在单时间片上利用CKG和图神经网络(GNN)的邻域传播机制学习用户和项目表征,还在多时间片上通过自注意力机制捕获用户长短期偏好以增强用户偏好表征;最后,基于反事实集的高阶连通子图捕获用户的多粒度个性化偏好,从而增强反事实解释。为验证ERCKCI机制的有效性,在公开数据集MovieLens(100k)、Book-crossing和MovieLens(1M)上进行了对比实验。所得结果表明,该机制在前两个数据集上相较于RCF(Relational Collaborative Filtering)推荐模型下的ECI(Explainable recommendation based on Counterfactual Inference),在解释保真度上分别提升了4.89和3.38个百分点,在CF集大小上分别降低了63.26%、66.24%,在稀疏度指标上分别提升了1.10和1.66个百分点,可见该机制能有效提升可解释性。

    基于Prompt学习的无监督关系抽取模型
    黄梦林, 段磊, 张袁昊, 王培妍, 李仁昊
    2023, 43(7):  2010-2016.  DOI: 10.11772/j.issn.1001-9081.2022071133
    摘要 ( )   HTML ( )   PDF (1353KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    无监督关系抽取旨在从无标签的自然语言文本中抽取实体之间的语义关系。目前,基于变分自编码器(VAE)架构的无监督关系抽取模型通过重构损失提供监督信号来训练模型,这为完成无监督关系抽取任务提供了新思路。针对此类模型无法有效地理解上下文信息、依赖数据集归纳偏置的问题,提出基于Prompt学习的无监督关系抽取(PURE)模型,其中包括关系抽取和链接预测两个模块。在关系抽取模块中设计了上下文感知的Prompt模板函数以融入上下文信息,并将无监督关系抽取任务转换为掩码预测任务,从而充分利用预训练阶段获得的知识完成关系抽取。在链接预测模块中则通过预测关系三元组中的缺失实体提供监督信号联合训练两个模块。在两个公开真实关系抽取数据集上进行了大量实验,得到的结果表明PURE模型能有效利用上下文信息并且不依赖数据集归纳偏置,相较于目前最优的基于VAE架构的模型UREVA (Variational Autoencoder-based Unsupervised Relation Extraction model)在NYT数据集上的B-cubed F1指标上提升了3.3个百分点。

    面向异构架构的关系型算子并发计算框架OmegaDB
    赖锦辉, 徐子晨, 涂亦澄, 谭国龙
    2023, 43(7):  2017-2025.  DOI: 10.11772/j.issn.1001-9081.2022071131
    摘要 ( )   HTML ( )   PDF (2915KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    数据库系统的不同查询之间存在访问数据路径重叠和计算共享的可能,而工作负载中的查询分批处理称为多条查询一次执行(Multiple-Query-at-a-Time)模型。一些已开发的多查询处理框架已经被证明有效,然而都缺乏构建完整查询处理和优化方法的普适框架。在基于等价变换来构建查询时算子合并优化框架的基础上,提出一种面向异构架构的关系型算子并发计算框架OmegaDB。该框架通过研究面向GPU的关系算子流批计算模型并构建关系数据查询流水,在CPU-GPU异构架构上实现了聚合多查询的流批计算方法。在实验及原型实现上,通过理论分析和实验结果验证OmegaDB相对传统关系型数据库管理系统(RDBMS)所具备的优势,以及OmegaDB利用新硬件的潜力。根据基于传统关系代数规则的多条查询一次执行模型的查询优化框架的理论研究,提出多个优化方法并展望未来研究方向。使用TPC-H商业智能计算作为基准测试程序,实验结果表明OmegaDB与现代先进的商业数据库系统SQL SERVER相比,在消耗更低的磁盘I/O和CPU时间的情况下,最高可以达到24倍的端到端加速。

    加权路网空间中动态聚集最近邻居查询算法
    陈方疏, 张为, 胡小明, 张宇飞, 孟宪凯, 石林祥
    2023, 43(7):  2026-2033.  DOI: 10.11772/j.issn.1001-9081.2022091371
    摘要 ( )   HTML ( )   PDF (2757KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    聚集最近邻居(ANN)查询作为空间数据库的经典问题在网络链路结构优化、物流集散点选址、共享汽车服务等方面有着重要的意义,能有效促进物流、移动互联网行业以及运筹学等领域的发展。现有的研究存在如下不足:缺少针对大规模动态路网数据的高效索引结构,在数据点位置实时移动以及路网权重动态更新的场景下算法的查询效率较低。针对上述不足,提出动态场景下的ANN查询算法。首先利用G-tree作为路网索引,提出将四叉树和k-d树等空间索引结构与增量欧氏空间限制(IER)算法结合起来的剪枝方法,以完成静态空间下的ANN查询;随后针对动态场景下数据点位置频繁更新的问题,加入时间窗口及安全区域更新策略,以减少算法的重复计算次数,实验结果表明效率能提高8%~85%;最后针对路网权重变化的ANN查询问题,提出两个基于校正的连续查询方法,在历史查询结果的基础上,根据权重变化的增量来得到当前的查询结果,在某些场景中能够有效降低50%左右的误差。理论研究和实验结果表明,所提算法能够高效并且较为准确地解决动态场景下的ANN查询问题。

    基于深度自回归模型的近似查询处理方法
    岑黎彬, 李靖东, 林淳波, 王晓玲
    2023, 43(7):  2034-2039.  DOI: 10.11772/j.issn.1001-9081.2022071128
    摘要 ( )   HTML ( )   PDF (1513KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    聚合函数的近似查询处理(AQP)是近年来数据库领域的研究热点。针对现有的近似查询技术存在查询响应时间长、存储开销大、不支持多谓词查询等问题,提出一种基于深度自回归模型的AQP方法DeepAQP (Deep Approximate Query Processing),利用深度自回归模型对表中多列数据的联合概率分布进行学习和建模,以估计给定查询的谓词选择度和目标列概率分布,以促进单表下多谓词聚合函数近似查询请求的有效处理。在TPC-H和TPC-DS数据集上进行实验,结果表明,与基于采样的VerdictDB方法相比,DeepAQP在查询响应时间和存储空间开销上均降低了2到3个数量级;与基于传统机器学习模型的DBEst++方法相比,DeepAQP的查询响应时间降低了1个数量级,显著降低了模型训练耗时,并且可以处理DBEst++所不支持的多谓词查询请求。可见,DeepAQP兼顾了查询精度和速度,并显著降低了算法在训练和存储上的开销。

    跨域环境下图流三角计数算法GTC
    曹春泽, 马德龙, 袁野
    2023, 43(7):  2040-2048.  DOI: 10.11772/j.issn.1001-9081.2022071130
    摘要 ( )   HTML ( )   PDF (1947KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的分布式三角计数算法假设所有计算节点位于同一地理位置,然而现实中它们可能位于跨洲际的多个数据中心中。跨域分布的数据中心使用广域网连接,具有网络带宽异质、通信费用高昂、分布不均等特点,而现有分布式算法无法适用于跨域环境。同时,现有研究较多采用随机采样、淘汰边等策略,忽略了三角形的形成具有时间局部性的特点。因此,研究了跨域环境中真实图流的三角计数问题并提出跨域三角计数(GTC)算法。首先针对现有边分发策略导致数据传输量过高的问题,提出一种跨域边分发策略,以结合通信的时间收益和数据收益建立收益公式,并使用点对点通信代替广播边;然后对于点对点通信在跨域环境中导致的三角形重复计数问题,提出终边计算规则,以确保无重复计数;最后基于时间加权采样算法提出时间加权三角计数算法,以利用三角形的时间局部性特点采样。在5个图流上把GTC与CoCoS (Conditional Counting and Sampling)、Tri-Fly进行对比的结果表明:GTC在通信数据量上比CoCoS减少了17%,比Tri-Fly减少了44%;在误差率上GTC比Tri-Fly减小了53%,略低于CoCoS;在算法运行时间上GTC比Tri-Fly减少了34%,略高于CoCoS。可见,GTC在保证较高准确率与较短算法运行时间的情况下,能有效减少通信数据量。

    增量数据上的闭合定量高效用项集挖掘算法
    单芝慧, 韩萌, 韩强
    2023, 43(7):  2049-2056.  DOI: 10.11772/j.issn.1001-9081.2022091333
    摘要 ( )   HTML ( )   PDF (2376KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    高效用项集(HUI)挖掘能够提供数据集中高利润的项的组合信息,有利于在现实应用中制定有效的营销策略。然而,HUI仅提供项集及其总效用,不提供单个项的购买数量,而现实场景中项的数量能提供更精准的信息。因此,研究者提出定量高效用项集(HUQI)挖掘算法。针对当前的HUQI挖掘算法仅能处理静态数据且存在结果集冗余的问题,提出增量更新的定量效用列表结构来存储并更新数据集中项的效用信息,并基于该结构提出一种挖掘闭合定量高效用项集(CHUQI)的算法。将所提出的算法与FHUQI-Miner (Faster High Utility Quantitative Itemset Miner)算法在结果集数量、最小效用阈值、批次数目以及可扩展性上对比时间与内存消耗。实验结果表明,所提算法能够有效处理增量数据,挖掘出更有趣的项集。

    本地化差分隐私下的频繁序列模式挖掘算法PrivSPM
    黄硕, 李艳辉, 曹建秋
    2023, 43(7):  2057-2064.  DOI: 10.11772/j.issn.1001-9081.2022091365
    摘要 ( )   HTML ( )   PDF (1710KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP应用于频繁序列模式挖掘带来了挑战。为解决这个问题,提出一种满足ε-LDP的top-k频繁序列模式挖掘算法PrivSPM。该算法结合填充和采样技术、自适应频率估计算法与频繁项预测技术来构造候选集;基于新域,利用基于指数机制的策略对用户数据进行扰动,并结合频率估计算法识别最终的频繁序列模式。理论分析证明了该算法满足ε-LDP。在3个真实数据集上的实验结果表明,PrivSPM算法在纳真率(TPR)和归一化累积排名(NCR)上明显高于对比算法,能有效提高挖掘结果的准确度。

    动态梯度阈值裁剪的差分隐私生成对抗网络算法
    陈少权, 蔡剑平, 孙岚
    2023, 43(7):  2065-2072.  DOI: 10.11772/j.issn.1001-9081.2022071114
    摘要 ( )   HTML ( )   PDF (1824KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    现有的生成对抗网络(GAN)和差分隐私相结合的方法大多采用梯度扰动的方法实现隐私保护,即在优化过程中利用梯度裁剪技术来约束优化器对单个数据的敏感性,并对裁剪后的梯度添加随机噪声以达到保护模型的目的。然而大多数方法在训练时裁剪阈值固定,而阈值过大或过小均会影响模型的性能。针对该问题,提出动态梯度阈值裁剪的DGC_DPGAN (Dynamic Gradient Clipping Differential Privacy Generative Adversarial Network)算法以兼顾隐私保护和模型的性能。该算法结合预训练技术,在优化过程中先求取每批次隐私数据的梯度F-范数均值作为动态梯度裁剪阈值,再对梯度进行扰动。考虑不同的裁剪顺序,提出先裁剪再加噪的CLIP_DGC_DPGAN (Clip Dynamic Gradient Clipping Differential Privacy Generative Adversarial Network)算法和先加噪再裁剪的DGC_DPGAN算法,并采用Rényi Accountant求取隐私损失。实验结果表明,在相同的隐私预算下,所提出的两种动态梯度裁剪算法与固定梯度阈值裁剪方法相比更优:在Mnist数据集上,所提两种算法在IS(Inception Score)、结构相似性(SSIM)、卷积神经网络(CNN)分类准确率上分别提升了0.32~3.92,0.03~0.27,7%~44%;在Fashion-Mnist数据集上,所提两种算法在IS、SSIM、CNN分类准确率上分别提升了0.40~4.32,0.01~0.44,20%~51%。同时,GAN模型生成图像的可用性更好。

    非独立同分布数据下的自正则化联邦学习优化方法
    蓝梦婕, 蔡剑平, 孙岚
    2023, 43(7):  2073-2081.  DOI: 10.11772/j.issn.1001-9081.2022071122
    摘要 ( )   HTML ( )   PDF (4171KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    联邦学习(FL)是一种新的分布式机器学习范式,它在保护设备数据隐私的同时打破数据壁垒,从而使各方能在不共享本地数据的前提下协作训练机器学习模型。然而,如何处理不同客户端的非独立同分布(Non-IID)数据仍是FL面临的一个巨大挑战,目前提出的一些解决方案没有利用好本地模型和全局模型的隐含关系,无法简单而高效地解决问题。针对FL中不同客户端数据的Non-IID问题,提出新的FL优化算法——联邦自正则(FedSR)和动态联邦自正则(Dyn-FedSR)。FedSR在每一轮训练过程中引入自正则化惩罚项动态修改本地损失函数,并通过构建本地模型和全局模型的关系来让本地模型靠近聚合丰富知识的全局模型,从而缓解Non-IID数据带来的客户端偏移问题;Dyn-FedSR则在FedSR基础上通过计算本地模型和全局模型的相似度来动态确定自正则项系数。对不同任务进行的大量实验分析表明,FedSR和Dyn-FedSR这两个算法在各种场景下的表现都明显优于联邦平均(FedAvg)算法、联邦近端(FedProx)优化算法和随机控制平均算法(SCAFFOLD)等FL算法,能够实现高效通信,正确率较高,且对不平衡数据和不确定的本地更新具有鲁棒性。

    融合好奇心和策略蒸馏的稀疏奖励探索机制
    王子腾, 于亚新, 夏子芳, 乔佳琪
    2023, 43(7):  2082-2090.  DOI: 10.11772/j.issn.1001-9081.2022071116
    摘要 ( )   HTML ( )   PDF (1696KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    深度强化学习算法在奖励稀疏的环境下,难以通过与环境的交互学习到最优策略,因此需要构建内在奖励指导策略进行探索更新。然而,这样仍存在一些问题:1)状态分类存在的统计失准问题会造成奖励值大小被误判,使智能体(agent)学习到错误行为;2)由于预测网络识别状态信息的能力较强,内在奖励产生状态的新鲜感下降,影响了最优策略的学习效果;3)由于随机状态转移,教师策略的信息未被有效利用,降低了智能体的环境探索能力。为了解决以上问题,提出一种融合随机生成网络预测误差与哈希离散化统计的奖励构建机制RGNP-HCE (Randomly Generated Network Prediction and Hash Count Exploration),并通过蒸馏(distillation)将多教师策略的知识迁移到学生策略中。RGNP-HCE机制采用好奇心分类思想构建融合奖励:一方面在多回合间以随机生成网络预测差构建全局好奇心奖励;另一方面在单回合内以哈希离散化统计构建局部好奇心奖励,从而保证内在奖励的合理性以及策略梯度更新的正确性。此外,将多个教师策略学习到的知识通过蒸馏迁移到学生策略中,有效提升学生策略的环境探索能力。最后,在Montezuma’s Revenge与Breakout测试环境中,把所提机制与当前主流的4个深度强化学习算法进行了对比实验,并执行了策略蒸馏。结果表明,相较于当前高性能的强化学习算法,RGNP-HCE机制在两个测试环境中的平均性能均有提升,且蒸馏后学生策略的平均性能又有进一步的提升,验证了RGNP-HCE机制与策略蒸馏方法对提升智能体的环境探索能力是有效的。

    时空众包中基于质量感知的在线激励机制
    潘亚楠, 潘庆先, 于兆一, 褚佳静, 于嵩
    2023, 43(7):  2091-2099.  DOI: 10.11772/j.issn.1001-9081.2022071095
    摘要 ( )   HTML ( )   PDF (2623KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在实时、复杂的网络环境中,如何激励工人参与任务并得到高质量的感知数据是时空众包研究的重点。基于此,提出一种基于质量感知的时空众包在线激励机制。首先,为了适应时空众包实时性的特点,提出一种阶段性在线选择工人算法(POA),该算法在预算约束下将整个众包活动周期分为多个阶段,每个阶段在线选择工人;其次,为了提高质量预估的精度与效率,提出一种改进的最大期望(IEM)算法,该算法在算法迭代的过程中优先考虑可信度高的工人提交的任务结果;最后,通过真实数据集上的对比实验,验证了所提激励机制在提高平台效用方面的有效性。实验结果表明,POA相较于改进的两阶段拍卖(ITA)算法、多属性与两阶段相结合的拍卖(M-ITA)算法,以及L-VCG(Lyapunov-based Vickrey-Clarke-Groves)等拍卖算法,效率平均提高了11.11%,工人的额外奖励金额平均提升了12.12%,可以激励工人向冷门偏远地区移动;在质量预估方面,IEM算法相比其他质量预估算法,在精度和效率上分别平均提高了5.06%和14.2%。

    融合出发地与目的地时空相关性的城市区域间出租车需求预测
    魏远, 林彦, 郭晟楠, 林友芳, 万怀宇
    2023, 43(7):  2100-2106.  DOI: 10.11772/j.issn.1001-9081.2022091364
    摘要 ( )   HTML ( )   PDF (1507KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    精准预测城市区域之间的出租车需求量,可以为出租车的引导和调度以及乘客的出行推荐提供决策支持信息,从而优化出租车的供需关系。然而现有模型大多以区域内的出租车需求量为建模和预测对象,对区域之间的时空相关性考虑不足,且较少关注区域之间更细粒度的需求量预测。针对上述问题,提出一种面向城市区域间出租车需求量的预测模型——出发地—目的地融合时空网络(ODSTN)模型。该模型分别从区域和区域对两个空间维度以及临近、日、周三个时间维度出发,采用图卷积和时间注意力机制来捕获区域之间的复杂时空相关性,并设计了一种新的路径感知融合机制来对多角度的特征进行融合,最终实现了对城市区域间出租车需求量的预测。在成都和曼哈顿地区两个真实出租车订单数据集中进行了实验,结果表明ODSTN模型的平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)分别为0.897 1、3.527 4、50.655 6%和0.589 6、1.163 8、61.079 4%。可见,ODSTN模型在出租车需求预测任务上具有较高的准确性。

    人工智能
    融合指针网络与关系嵌入的三元组联合抽取模型
    拓雨欣, 薛涛
    2023, 43(7):  2116-2124.  DOI: 10.11772/j.issn.1001-9081.2022060846
    摘要 ( )   HTML ( )   PDF (1576KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对自然语言文本中实体重叠情况复杂、多个关系三元组提取困难的问题,提出一种融合指针网络与关系嵌入的三元组联合抽取模型。首先利用BERT (Bidirectional Encoder Representations from Transformers)预训练模型对输入句子进行编码表示;然后利用首尾指针标注抽取句子中的所有主体,并采用主体和关系引导的注意力机制来区分不同关系标签对每个单词的重要程度,从而将关系标签信息加入句子嵌入中;最后针对主体及每一种关系利用指针标注和级联结构抽取出相应的客体,并生成关系三元组。在纽约时报(NYT)和网络自然文本生成(WebNLG)两个数据集上进行了大量实验,结果表明,所提模型相较于目前最优的级联二元标记框架(CasRel)模型,整体性能分别提升了1.9和0.7个百分点;与基于跨度的提取标记方法(ETL-Span)模型相比,在含有1~5个三元组的对比实验中分别取得了大于6.0%和大于3.7%的性能提升,特别是在含有5个以上三元组的复杂句子中,所提模型的F1值分别提升了8.5和1.3个百分点,且在捕获更多实体对的同时能够保持稳定的提取能力,进一步验证了该模型在三元组重叠问题中的有效性。

    基于语义与全局双重注意力机制的长链非编码RNA-疾病关联预测模型
    张奕, 蔡钢生, 王真梅
    2023, 43(7):  2125-2132.  DOI: 10.11772/j.issn.1001-9081.2022060872
    摘要 ( )   HTML ( )   PDF (781KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有长链非编码RNA (lncRNA)-疾病关联预测模型在综合利用异构生物网络的交互、语义信息上存在局限性的问题,提出一种基于语义与全局双重注意力机制的lncRNA-疾病关联预测模型(SGALDA)。首先,基于相似性和已知关联构建一个lncRNA-疾病-微小RNA(miRNA)异构网络,并基于消息传递类型设计特征提取模块来提取和融合异构网络上同质、异质节点的邻域特征,以捕捉异构网络上的多层面交互关系。其次,基于元路径将异构网络分解为多个语义子网络,并分别在各个子网络上应用图卷积网络(GCN)来提取节点的语义特征,以捕捉异构网络上的高阶交互关系。然后,基于语义与全局双重注意力机制融合节点的语义和邻域特征,以获得更具代表性的节点特征。最后,利用lncRNA节点特征和疾病节点特征的内积运算重建lncRNA-疾病关联。5折交叉验证结果显示,SGALDA的受试者工作特征曲线下面积(AUROC)为0.994 5±0.000 2,PR曲线下面积(AUPR)为0.916 7±0.001 1,在所有对比模型中均为最高,验证了SGALDA良好的预测性能。对乳腺癌、胃癌的案例研究进一步证实了SGALDA识别潜在lncRNA-疾病关联的能力,说明SGALDA有潜力成为一种可靠的lncRNA-疾病关联预测模型。

    基于领域融合和时间权重的招工推荐模型
    叶坤佩, 熊熙, 丁哲
    2023, 43(7):  2133-2139.  DOI: 10.11772/j.issn.1001-9081.2022060802
    摘要 ( )   HTML ( )   PDF (1499KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对推荐系统使用嵌入层&多层感知机(Embedding&MLP)范式学习用户表示时强特征过拟合和弱特征欠拟合的问题,以及使用门控循环单元(GRU)学习用户兴趣时没有考虑到当前行为对用户最终兴趣的影响力会随时间推移逐渐减弱的问题,设计了一种基于领域融合和时间权重的招工推荐模型(RecRec)。首先,RecRec采用新的领域融合层来代替传统的串联层,而领域融合层在多域特征上表现出显著的优越性能。然后,RecRec在兴趣演化层将时间权重融入GRU,并提出时间戳门控循环单元(TSGRU),而TSGRU能更准确地学习用户兴趣。最终,RecRec通过预测用户拨通率来实现个性化推荐。实验结果表明,相较于YouTube DNN、Wide&Deep、融合注意力LSTM的协同过滤算法(ALAMF)和分期序列自注意力网络(LSSSAN),RecRec的AUC提高了0.03~0.36个百分点,说明RecRec能有效学习用户表示和用户兴趣。

    基于改进证据融合的高可靠产品可靠性评估方法
    王思蕊, 程世娟, 袁非梦
    2023, 43(7):  2140-2146.  DOI: 10.11772/j.issn.1001-9081.2022060867
    摘要 ( )   HTML ( )   PDF (1351KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    对许多高可靠、高价值的产品进行可靠性评估时,常由于客观试验数据缺乏导致无法对产品可靠性进行准确评估。针对这个问题,为充分利用不同来源的可靠性信息,提出一种基于改进证据融合的高可靠产品可靠性评估方法。首先,结合可靠性工程特点,分别由各证据在信度层、决策层的一致性以及证据自身的不确定度来确定证据修正权重;其次,基于博弈论原理对各权重向量进行线性组合,从而得到最优综合权重;最后,利用Dempster组合规则融合修正后的证据,并通过Pignistic概率转化公式得到产品可靠性指标的概率分布,以完成产品可靠性评估。某电子设备的可靠度评估结果显示,所提方法相较于同样考虑多维权重修正的Jiang组合方法和Yang组合方法,赋予冲突区间的信度分别减小了69.6%、54.6%,赋予整个识别框架的信度分别减小了5.6%、3.7%。因此,在可靠性工程应用中,所提方法化解证据冲突、降低融合结果不确定性的表现优于对比方法,能够有效融合多源可靠性信息,提高产品可靠性评估结果可信度。

    基于改进VarifocalNet的高精度目标检测算法
    姬张建, 张明, 王子龙
    2023, 43(7):  2147-2154.  DOI: 10.11772/j.issn.1001-9081.2022060823
    摘要 ( )   HTML ( )   PDF (2629KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对通用目标检测场景下,现有单阶段无锚检测器识别精度低、识别困难等问题,提出一种基于改进变焦网络VFNet(VarifocalNet)的高精度目标检测算法。首先,利用循环层聚合网络(RLANet)替换VFNet用于特征提取的主干网络ResNet,循环残差连接操作将前层特征汇入后续网络层中提升特征的表征能力;其次,通过带有特征对齐卷积操作的特征金字塔网络(FPN)替换原始的特征融合网络,利用可变形卷积操作在FPN上下层融合过程中实现特征对齐并优化特征表征能力;最后,使用聚焦-全局蒸馏(FGD)算法进一步提升小规模算法的检测性能。在COCO (Common Objects in Context) 2017数据集上进行的评估实验结果表明,在相同训练条件下,改进后的以RLANet-50为主干的算法的均值平均精度(mAP)可以达到45.9%,与VFNet算法相比提升了4.3个百分点,而改进后的算法参数量为36.67×106,与VFNet相比仅高了4×106。可见,改进后的VFNet算法在提升检测精度的同时稍微增加了参数量,说明该算法可以满足目标检测的轻量化及高精度需求。

    基于点云补全和多分辨Transformer的弱感知目标检测方法
    周静, 胡怡宇, 胡成玉, 王天江
    2023, 43(7):  2155-2165.  DOI: 10.11772/j.issn.1001-9081.2022060908
    摘要 ( )   HTML ( )   PDF (3409KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对远距离或遮挡场景中形状缺失的弱感知目标的检测精确率低下的问题,提出一种基于点云补全和多分辨Transformer的弱感知目标检测方法(WP-CMT)。首先,考虑到目标检测网络中的下采样卷积操作会导致部分关键信息的丢失,选取具有反卷积上采样结构的部分感知聚合(Part-A2)方法作为基础网络以生成初始候选框;然后,为增强初始候选框中的弱感知目标形状及位置特征,采用点云补全模块重构弱感知目标表面的密集点集,并构建新颖的多分辨Transformer特征编码模块来聚合弱感知目标的补全形状特征和原始空间位置信息,通过逐步编码不同分辨率局部坐标点集上的聚合特征的上下文语义相关性来捕获弱感知目标增强的局部特征,最终生成精细化的目标检测框。实验结果表明:对于KITTI和Waymo数据集中的弱感知困难级别目标,WP-CMT的平均精确率和平均精确率均值分别比基准方法Part-A2提升了2.51和1.59个百分点,验证了该方法对弱感知目标检测的有效性。同时,消融实验结果表明WP-CMT中的点云补全和多分辨Transformer特征编码模块对于不同类型的区域候选网络(RPN)结构均能有效提升弱感知目标的检测性能。

    基于通道注意力和边缘融合的伪装目标分割方法
    詹春兰, 王安志, 王明辉
    2023, 43(7):  2166-2172.  DOI: 10.11772/j.issn.1001-9081.2022060933
    摘要 ( )   HTML ( )   PDF (2120KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    伪装目标分割(COS)的目标是从背景中分离出隐藏的目标对象。近年来,基于卷积神经网络(CNN)的伪装目标检测(COD)发展迅速,然而仍存在无法从前/背景高度相似的场景中准确地检测出完整目标对象的问题。针对上述问题,提出一种基于通道注意力(CA)和边缘融合的COS方法CANet (Network based on Channel Attention and edge fusion),以得到伪装目标的边缘细节更清晰的完整分割结果。首先,引入压缩和激励(SE)注意力模块,以提取更丰富的高级语义特征;其次,提出一个边缘融合模块,抑制低级特征中的干扰,并充分利用图像的边缘细节信息;最后,设计了基于深度可分离卷积的通道注意力模块,以自上而下的方式逐步融合跨级的多尺度特征,进一步地提升检测精度和效率。在多个公开的COD数据集上的实验结果表明,相较于SINet (Search Identification Net)、TINet (Texture-aware Interactive guidance Network)和C2FNet (Context-aware Cross-level Fusion Network)等8种主流的方法,CANet表现更佳,且能够获取到丰富的伪装目标内部及边缘细节信息,而且在具有挑战性的COD10K数据集上结构度量指标相较于SINet提升了2.6个百分点。CANet性能优越,适用于医学上检测与人体组织相似的病灶区域、军事领域检测隐蔽目标等相关领域。

    轻量化篮球裁判手势识别算法
    李忠雨, 孙浩东, 李娇
    2023, 43(7):  2173-2181.  DOI: 10.11772/j.issn.1001-9081.2022060810
    摘要 ( )   HTML ( )   PDF (4447KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对一般手势识别算法的参数量、计算量和精度难以平衡的问题,提出一种轻量化篮球裁判手势识别算法。该算法在YOLOV5s (You Only Look Once Version 5s)算法的基础上进行重构:首先,用Involution算子替代CSP1_1的卷积算子,以扩大上下文信息捕获范围并减少核冗余;其次,在C3模块后加入协同注意力(CA)机制,以得到更强的手势特征提取能力;然后,用轻量化内容感知上采样算子改进原始上采样模块,并将采样点集中在目标区域而忽略背景部分;最后,利用以SiLU作为激活函数的Ghost-Net进行轻量化剪枝。在自制的篮球裁判手势数据集上的实验结果表明,该轻量化篮球裁判手势识别算法的计算量、参数量和模型大小分别为3.3 GFLOPs、4.0×106和8.5 MB,与YOLOV5s算法相比,分别减少了79%、44%和40%,mAP@0.5为91.7%,在分辨率为1 920×1 280的比赛视频上的检测帧率达到89.3 frame/s,证明该算法能满足低误差、高帧率和轻量化的要求。

    基于多模态图卷积神经网络的行人重识别方法
    何嘉明, 杨巨成, 吴超, 闫潇宁, 许能华
    2023, 43(7):  2182-2189.  DOI: 10.11772/j.issn.1001-9081.2022060827
    摘要 ( )   HTML ( )   PDF (1887KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对行人重识别中行人文本属性信息未被充分利用以及文本属性之间语义联系未被挖掘的问题,提出一种基于多模态的图卷积神经网络(GCN)行人重识别方法。首先使用深度卷积神经网络(DCNN)学习行人文本属性与行人图像特征;然后借助GCN有效的关系挖掘能力,将文本属性特征与图像特征作为GCN的输入,通过图卷积运算来传递文本属性节点间的语义信息,从而学习文本属性间隐含的语义联系信息,并将该语义信息融入图像特征中;最后GCN输出鲁棒的行人特征。该多模态的行人重识别方法在Market-1501数据集上获得了87.6%的平均精度均值(mAP)和95.1%的Rank-1准确度;在DukeMTMC-reID数据集上获得了77.3%的mAP和88.4%的Rank-1准确度,验证了所提方法的有效性。

    数据科学与技术
    基于motif连通性的社区搜索方法
    杜明, 顾万里, 周军锋, 王志军
    2023, 43(7):  2190-2199.  DOI: 10.11772/j.issn.1001-9081.2022060941
    摘要 ( )   HTML ( )   PDF (2711KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    社区搜索的目标是从数据图中得到包含查询顶点的紧密子图,在社会学、生物学等领域有着广泛应用。针对现有基于子图连通性的社区模型的基础连通结构都是完全连通图,无法满足实际应用中用户对社区结构多样性的需求的问题,提出一种基于motif连通性的社区搜索方法,其中包括基于motif连通性的社区(MCC)模型以及两个相应的社区搜索算法——MPCS (Motif-Processed Community Search)算法和基于MP-index的社区搜索算法。MCC模型可以协助用户自由指定社区的基础连通结构,MPCS算法可以用来解决MCC的搜索问题。此外,提出两个分别针对motif实例搜索过程及所属社区判断过程的剪枝优化技术。最后,设计了MP-index以避免社区搜索过程中的冗余遍历操作。在多个真实数据集上进行实验的结果表明:剪枝优化可以使MPCS算法的耗时减少60%~85%,而基于MP-index的社区搜索算法相较于加入剪枝优化的MPCS算法,效率提升普遍达到了2~3个数量级。可见,所提方法在商品推荐和社交网络等问题上有着实际应用价值。

    基于数据索引结构的跨级高效用项集挖掘算法
    蒋华, 李星, 王慧娇, 韦静海
    2023, 43(7):  2200-2208.  DOI: 10.11772/j.issn.1001-9081.2022060907
    摘要 ( )   HTML ( )   PDF (1910KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有的跨级高效用项集挖掘(HUIM)算法非常耗时且占用大量内存的问题,提出一种基于数据索引结构的跨级高效用项集挖掘算法(DISCH)。首先,为了高效存储和快速检索到搜索空间中的所有项集,拓展带有分类信息和索引信息的效用链表为数据索引结构(DIS);然后,为了提高内存利用率,对不满足条件的效用链表所占的内存进行回收再分配;最后,在构建效用链表时使用提前结束策略,以减少效用链表的产生。基于真实零售数据集和合成数据集进行的实验结果表明,与CLH-Miner (Cross-Level High utility itemsets Miner)算法相比,DISCH在运行时间上平均降低了77.6%,同时在内存消耗上平均降低了73.3%,可见该算法能高效完成跨级高效用项集的搜索,并且降低算法的内存消耗。

    网络空间安全
    边缘计算下基于区块链的隐私保护联邦学习算法
    陈宛桢, 张恩, 秦磊勇, 洪双喜
    2023, 43(7):  2209-2216.  DOI: 10.11772/j.issn.1001-9081.2022060909
    摘要 ( )   HTML ( )   PDF (1974KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对在边缘计算(EC)场景下进行的联邦学习(FL)过程中存在的模型参数隐私泄露、不可信服务器可能返回错误的聚合结果以及参与训练的用户可能上传错误或低质量模型参数的问题,提出一种边缘计算下基于区块链的隐私保护联邦学习算法。在训练过程中,每个用户首先使用全局模型参数在其本地数据集上进行训练,并将训练得到的模型参数以秘密共享的方式上传至附近的边缘节点,从而实现对用户本地模型参数的保护;然后由边缘节点在本地计算它们所收到的模型参数的份额之间的欧氏距离,并将结果上传至区块链;最后由区块链负责对模型参数之间的欧氏距离进行重构,进而在去除有毒的更新后,再进行全局模型参数的聚合。通过安全分析证明了所提算法的安全性:即使在部分边缘节点合谋的情况下,用户的本地模型参数信息也不会泄露。同时实验结果表明该算法具有较高的准确率:在投毒样本比例为30%时,它的模型准确率为94.2%,接近没有投毒样本时的联邦平均(FedAvg)算法的模型准确率97.8%,而在投毒样本比例为30%时FedAvg算法的模型准确率下降至68.7%。

    基于改进MobileNetV2的恶意代码分类方法
    轩勃娜, 李进, 宋亚飞, 马泽煊
    2023, 43(7):  2217-2225.  DOI: 10.11772/j.issn.1001-9081.2022060931
    摘要 ( )   HTML ( )   PDF (3547KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对传统恶意代码分类方法存在的精度不足、预测时间成本高和抗混淆能力弱等问题,提出一种基于改进MobileNetV2的恶意代码分类方法。首先,针对恶意代码加密和混淆等问题,使用坐标注意力(CA)方法引入更大范围的空间位置来增强恶意代码图像的特征;然后,针对从头开始训练导致的训练成本过高的问题,使用迁移学习(TL)来改进MobileNetV2的学习方式以提升抗混淆能力;最后,针对传统深度学习网络计算量大和收敛慢的问题,使用MobileNetV2轻量化卷积网络模型,并结合Ranger21改进训练方式以促进网络迅速收敛。实验结果表明:上述方法对Malimg数据集和DataCon数据集的准确率分别达到了99.26%和96.98%。在malimg数据集相较于AlexNet方法在准确率上平均提升了1.49%,检测效率上平均提升了45.31%;在DataCon数据集相较于集成学习方法准确率平均提升了1.14%。可见,基于改进MobileNetV2的恶意代码分类方法可以提升模型的泛化能力、抗混淆能力与分类效率。

    先进计算
    基于权重向量聚类的动态多目标进化算法
    李二超, 程艳丽
    2023, 43(7):  2226-2236.  DOI: 10.11772/j.issn.1001-9081.2022060843
    摘要 ( )   HTML ( )   PDF (3030KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    实际生活中存在许多的动态多目标优化问题(DMOP)。对于此类问题,当环境发生改变时,就要求动态多目标进化算法(DMOEA)能快速和准确地跟踪新环境下的帕累托前沿(PF)或帕累托最优解集(PS)。针对现有算法的种群预测性能差的问题,提出一种基于权重向量聚类预测的动态多目标进化算法(WVCP)。该算法首先在目标空间中生成均匀的权重向量,并对种群中的个体进行聚类,再根据聚类情况分析种群的分布性。其次,对聚类个体的中心点建立时间序列。对同一权重向量,针对不同的聚类情况采取相应的应对策略对个体进行补充,若相邻时刻均存在聚类中心,则采用差分模型预测新环境下的个体;若某一时刻不存在聚类中心,则用相邻权重向量聚类中心的质心作为该时刻的聚类中心,再运用差分模型预测个体。这样不仅可以有效地解决种群分布性差的问题,还可以提高预测的准确性。最后,引入个体补充策略,以充分地利用历史信息。为验证WVCP算法的性能,把它与四种代表性算法进行了仿真对比。实验结果表明,所提算法能够很好地解决DMOP。

    信息迁移多任务优化共生生物搜索算法
    程美英, 钱乾, 熊伟清
    2023, 43(7):  2237-2247.  DOI: 10.11772/j.issn.1001-9081.2022060896
    摘要 ( )   HTML ( )   PDF (3862KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有共生生物搜索(SOS)算法只能求解单个任务,以及信息负迁移影响多任务优化(MTO)性能这两个难题,提出一个信息迁移多任务优化共生生物搜索(ITMTSOS)算法。首先基于多种群演化MTO框架,根据任务个数设置相应数量种群;然后各种群独立运行基本SOS算法,当某一种群连续若干代停滞进化时,引入个体自身最优经验和邻域最优个体以形成知识模块并将该模块迁移至该种群个体进化过程中;最后对ITMTSOS算法时间和空间复杂度进行分析。仿真实验结果表明,ITMTSOS算法同时求解多个不同形态高维函数时均能快速收敛至全局极值解0,与单任务SOS算法相比,平均运行时间最多缩短约25.25%;而在同时求解多维0/1背包问题和师生匹配问题时,所提算法在测试集weing1和weing7上的最优适应值与目前测试集公布的最优结果相比分别提高了22 767和22 602,师生最优匹配差和平均匹配差的绝对值分别下降了26和33,平均运行时间约缩短了7.69%。

    求解带容量约束车辆路径问题的多模态差分进化算法
    林剑, 叶璟轩, 刘雯雯, 邵晓雯
    2023, 43(7):  2248-2254.  DOI: 10.11772/j.issn.1001-9081.2022060812
    摘要 ( )   HTML ( )   PDF (1138KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对带容量约束车辆路径问题(CVRP)中交通拥堵、资源供给、客户需求等不确定性因素的影响容易导致单一最优解不可行或非最优的问题,提出一种多模态差分进化(MDE)算法,以同时求解得到目标值相近的多个备选车辆路径方案。首先结合CVRP的特点,构建高效的解个体编解码策略,并基于修复机制提升解个体的质量;然后在差分进化(DE)算法框架下,基于多模态优化视角引入动态半径小生境生成方法,并采用杰卡德系数来度量解个体之间相似性,进而实现对于解个体之间距离的计算;最后,改进邻域搜索策略,采用精英存档和更新策略来得到多模态最优解集。基于典型数据集的仿真实验与分析结果表明,所提MDE算法寻优得到的平均最优解个数达到1.743 4个,平均最优解与已知最优解的平均偏差为0.03%,而差分进化(DE)算法二者分别为0.8486和0.63%。可见,所提算法在求解CVRP上表现出较高的有效性和稳定性,能同时得到CVRP的多个近似最优解。

    网络与通信
    基于精确时间协议的工业无线传感器网络时间同步方法
    单飞桥, 王照伟, 沈跃
    2023, 43(7):  2255-2260.  DOI: 10.11772/j.issn.1001-9081.2022060825
    摘要 ( )   HTML ( )   PDF (1545KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对工业无线传感器网络(IWSNs)中复杂链路环境、温度波动等造成的链路时延动态变化、时钟计时干扰、时间戳获取不确定等问题,提出一种基于精确时间协议(PTP)的IWSNs时间同步方法。首先,融合PTP双向时间同步过程的时钟计时干扰、非对称链路时延噪声,建立时钟状态空间模型和观测模型;其次,构建反向自适应卡尔曼滤波算法以滤除噪声干扰;然后,利用反向估计和正向估计的时钟状态归一化新息比值来评估噪声统计模型的合理性;最后,在设定检测阈值后,动态调整时钟状态过程噪声,以实现时钟参数的精确估计。仿真结果表明,相较于经典卡尔曼滤波算法和PTP,在不同时钟计时精度下,反向自适应卡尔曼滤波算法估计的时钟偏移和偏移率均有较小且更稳定的误差标准差,有效解决了噪声不确定等原因造成的卡尔曼滤波发散问题,提高了时间同步的可靠性。

    计算机软件技术
    体系结构动态变化的软件测试资源分配算法
    李磊, 张国富, 苏兆品, 岳峰
    2023, 43(7):  2261-2270.  DOI: 10.11772/j.issn.1001-9081.2022060824
    摘要 ( )   HTML ( )   PDF (1050KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    测试资源分配是软件测试中的一个核心问题。已有相关研究大都假设软件的体系结构是静态不变的,且几乎没有考虑成本约束。针对该问题,提出一种体系结构动态变化的软件测试资源分配算法。首先构建了一种体系结构动态变化的多阶段多目标多约束测试资源分配模型;然后基于参数重估计、广义差分进化,在算法中加入了种群重新初始化,该方法能减小算法搜索空间并提升算法性能;最后在算法中加入了一种新的修复处理机制,该机制能有效剔除算法产生的无效解。与归一化加权求和多目标差分进化(WNS-MODE)算法和基于第三代广义差分进化的动态测试资源分配(DTRA-GDE3)算法相比,所提算法获得的解集的容量值分别提高了约11.81倍和0.39倍。在覆盖值指标方面,所提算法完全覆盖了WNS-MODE算法,并且相对于DTRA-GDE3算法提高了81个百分点。在超体积值指标方面,所提算法分别提高了近6倍和9倍。实验结果表明,所提算法能够更好地适应软件体系结构的动态变化,可为软件产品的动态测试提供更多和更优的测试资源分配方案,并满足用户需求的动态变化。

    离散事件系统最优监督控制算法
    胡瑜洪, 王德光, 何家汉, 张志恒
    2023, 43(7):  2271-2279.  DOI: 10.11772/j.issn.1001-9081.2022060884
    摘要 ( )   HTML ( )   PDF (3280KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    离散事件系统的监控器可以通过禁止可控事件来使系统满足安全性和活性规范。然而,监控器并不对允许发生的可控事件主动进行选择,所以存在同时允许多个可控事件发生的情况。但在实际应用中,如交通调度、机器人路径规划中,要求系统在每个状态下最多只允许一个可控事件的发生。针对上述问题,引入一种最优机制来量化控制成本,并提出一种离散事件系统最优监督控制算法,以确保系统的安全性和活性,并使事件执行累计的成本最小。首先,给定受控系统和行为约束的自动机模型,并基于Ramadge和Wonham的监督控制理论求解出无阻塞和行为最大许可的监控器;其次,通过定义的成本函数为监控器中每个事件的执行赋予相应成本;最后,利用动态规划思想迭代计算求解出最优定向监控器,从而实现每个状态下最多发生一个可控事件和事件执行累计的成本最小的目标。使用单向列车导轨案例和多轨道列车控制案例来验证所提算法的有效性和正确性。对于上述两个案例,所提算法求解的定向监控器到达目标状态所需的事件执行累计的成本分别为26.0和14.0,低于贪心算法的27.5和16.0,以及Q-learning算法的26.5和14.0。

    多媒体计算与计算机仿真
    融合迭代反馈与注意力机制的图像超分辨重建方法
    梁敏, 刘佳艺, 李杰
    2023, 43(7):  2280-2287.  DOI: 10.11772/j.issn.1001-9081.2022060877
    摘要 ( )   HTML ( )   PDF (3427KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对图像超分辨重建过程中原始高清图片与低质量图像之间缺乏依赖关系、深度网络中特征图信息不分主次重构导致的图像高频信息高精度重构困难的问题,提出一种融合迭代反馈与注意力机制的单幅图像超分辨重建方法。首先使用频率分解模块分别提取图像中的高、低频信息,并将二者分别处理,使网络重点关注提取出的高频细节部分,增强方法在图像细节上的复原能力;其次通过通道注意力机制将重建的重点放在有效特征所在的特征通道上,增强网络提取特征图信息的能力;然后采用迭代反馈的思想,在反复重建和比对过程中增加图像的还原程度;最后通过重建模块生成输出图像。在Set5、Set14、BSD100、Urban100和Manga109基准数据集上的2倍、4倍和8倍放大实验中,与主流超分辨率方法相比,所提方法表现出更优越的性能。在Manga109数据集的8倍放大实验中,相较于传统插值方法和基于卷积神经网络的图像超分辨率算法(SRCNN),所提方法的峰值信噪比(PSNR)均值分别提升了约3.01 dB和2.32 dB。实验结果表明:所提方法能够降低重建过程中出现的误差,并有效重建出更精细的高分辨率图像。

    基于主动判别机制的自适应生成对抗网络图像去模糊算法
    刘安阳, 赵怀慈, 蔡文龙, 许泽超, 解瑞灯
    2023, 43(7):  2288-2294.  DOI: 10.11772/j.issn.1001-9081.2022060840
    摘要 ( )   HTML ( )   PDF (2675KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对现有图像去模糊算法在处理边缘丢失时出现弥散和伪影以及在视频处理中使用全帧去模糊方式导致不满足实时性需求的问题,提出一种基于主动判别机制的自适应生成对抗网络图像去模糊(ADBGAN)算法。首先,提出一种自适应模糊判别机制,开发了自适应模糊处理网络模块对输入图像进行模糊先验判断。在采集到输入时提前判断输入图像的模糊程度,从而剔除足够清晰的输入帧以提升算法运行效率。然后,在精细特征提取过程中引入注意力机制中的激励环节,从而在特征提取的流程中进行权重归一化来提升网络对精细特征的恢复能力。最后,在生成器架构中改进了特征金字塔精细特征恢复结构,并采用更轻量化的特征融合流程提高运行效率。为验证算法的有效性,在开源数据集GoPro和Kohler上进行了详细的对比实验。实验结果显示,在GoPro数据集中ADBGAN的视觉保真度是尺度循环网络(SRN)算法的2.1倍,并在峰值信噪比(PSNR)上较SRN算法提升了0.762 dB,具有良好的图像信息恢复能力;在视频数据处理时间上ADBGAN大幅超越了测试的所有算法,实测处理时间较SRN减少了85.9%。ADBGAN能够高效生成信息质量更高的去模糊图像。

    改进注意力机制的电梯场景下危险品检测方法
    郭奕裕, 周箩鱼, 刘新瑜, 李尧
    2023, 43(7):  2295-2302.  DOI: 10.11772/j.issn.1001-9081.2022060857
    摘要 ( )   HTML ( )   PDF (5447KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对电动自行车和煤气罐搭乘电梯引起的火灾隐患,提出一种改进注意力机制的电梯场景下危险品检测方法。以YOLOX-s为基线模型,首先在加强特征提取网络中引入深度可分离卷积替换标准卷积,提升模型的推理速度。然后提出一种基于混合域的高效卷积块注意力模块(ECBAM)并嵌入主干特征提取网络中。在ECBAM模块的通道注意力部分,使用一维卷积替换两个全连接层,既降低了卷积块注意力模块(CBAM)的复杂度又提高了检测精度。最后提出一种多帧协同算法,通过结合多张图片的危险品检测结果以减少危险品入侵电梯的误报警。实验结果表明:改进后模型比YOLOX-s的平均精度均值(mAP)提升了1.05个百分点,浮点计算量降低了34.1%,模型体积减小了42.8%。可见改进后模型降低了实际应用中的误报警,且满足电梯场景下危险品检测的精度和速度要求。

    基于多尺度特征融合和网格注意力机制的三维肝脏影像分割方法
    郑帅, 张晓龙, 邓鹤, 任宏伟
    2023, 43(7):  2303-2310.  DOI: 10.11772/j.issn.1001-9081.2022060803
    摘要 ( )   HTML ( )   PDF (2868KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    在计算机断层扫描(CT)和磁共振成像(MRI)的影像中肝脏与邻近脏器的灰度值相似性都比较高,为自动精确地分割肝脏,提出一种基于多尺度特征融合和网格注意力机制的三维肝脏影像分割方法MAGNet (Multi-scale feature fusion And Grid attention mechanism Network)。首先,通过注意力引导连接模块来连接高层特征和低层特征以提取出重要的上下文信息,并且在注意力引导连接模块中引入网格注意力机制来关注感兴趣的分割区域;然后,通过在单个特征图中按通道数进行分层连接形成多尺度特征融合模块,并用该模块替换基础卷积块以获取多尺度语义信息;最后,利用深度监督机制解决梯度消失、梯度爆炸和收敛过慢等问题。实验结果表明:在3DIRCADb数据集上,与U3-Net+DC方法相比,MAGNet在Dice相似系数(DSC)指标上提升了0.10个百分点,在相对体积差(RVD)指标上降低了1.97个百分点;在Sliver07数据集上,与CANet方法相比,MAGNet在DSC指标上提升了0.30个百分点,在体素重叠误差(VOE)指标上降低了0.68个百分点,在平均对称表面距离(ASD)和对称位置表面距离的均方根(RMSD)指标上分别降低了0.03 mm和0.22 mm;在某医院肝脏MRI数据集上,MAGNet在所有指标上也均具有良好的结果。另外,将MAGNet应用于3DIRCADb数据集和某医院肝脏MRI数据集进行混合形成的数据集,也取得了非常有竞争力的分割效果。

    基于注意力特征金字塔网络的肺结节检测算法
    秦源源, 张鸿
    2023, 43(7):  2311-2318.  DOI: 10.11772/j.issn.1001-9081.2022060924
    摘要 ( )   HTML ( )   PDF (2687KB) ( )  
    数据和表 | 参考文献 | 相关文章 | 计量指标

    针对肺结节计算机辅助检测(CAD)系统中肺结节形态各异难以检测带来的敏感度低、假阳性率高的问题,提出一种基于注意力特征金字塔网络的肺结节检测算法。在第一阶段,以更加紧凑的双路径网络(DPN)为骨干网络,并结合特征金字塔网络(FPN)进行多尺度预测,以获取不同层次的特征信息,同时嵌入全局注意力机制(GAM)来细化学习要强调的语义特征,并提高算法的敏感度;在第二阶段,提出一种假阳性抑制网络,以获得最终分类预测结果;在训练阶段,采用焦点损失函数和多种数据增强技术来处理数据不平衡问题。在公开数据集LUNA16 (LUng Nodule Analysis 2016)上的实验结果显示:仅有第一阶段的算法的竞争性能指标(CPM)达到了0.908,而加入假阳性抑制网络后算法的CPM达到了0.933,这与经典算法基于最大强度投影(MIP)的卷积神经网络(CNN)算法相比提升了1.1个百分点;而消融实验的结果表明DPN、FPN、GAM对于提升检测敏感度是有作用的。以上证明了所提出的两阶段检测算法可以获取多尺度结节信息,提高肺结节检测的敏感度,并且降低假阳性率。

2024年 44卷 7期
刊出日期: 2024-07-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会