视觉目标跟踪是计算机视觉中的重要任务之一,为实现高性能的目标跟踪,近年来提出了大量的目标跟踪方法,其中基于Transformer的目标跟踪方法由于具有全局建模和联系上下文的能力,是目前视觉目标跟踪领域研究的热点。首先,根据网络结构的不同对基于Transformer的视觉目标跟踪方法进行分类,概述相关原理和模型改进的关键技术,总结不同网络结构的优缺点;其次,对这类方法在公开数据集上的实验结果进行对比,分析网络结构对性能的影响,其中MixViT-L(ConvMAE)在LaSOT和TrackingNet上跟踪成功率分别达到了73.3%和86.1%,说明基于纯Transformer两段式架构的目标跟踪方法具有更优的性能和更广的发展前景;最后,对方法当前存在的网络结构复杂、参数量大、训练要求高和边缘设备使用难度大等不足进行总结,并对今后的研究重点进行展望,通过与模型压缩、自监督学习以及Transformer可解释性分析相结合,可为基于Transformer的视觉目标跟踪提出更多可行的解决方案。
无人机(UAV)协助下非正交多址接入(NOMA)使能的数据采集系统,考虑了地空概率信道模型和服务质量约束,并联合优化UAV三维布局设计和传感器功率分配最大化所有传感器的总能效。针对原混合整数非凸规划问题,提出了一种基于凸优化理论、深度学习理论和哈里斯鹰优化(HHO)算法的能效优化机制。在任意给定的UAV三维布局下,首先将功率分配子问题等价转化为凸优化问题;其次基于最优的功率分配方案,采用深度神经网络(DNN)构建从传感器位置到UAV三维布局的映射,并利用HHO算法离线训练最佳映射对应的模型参数。训练后的机制仅需执行少量代数运算并求解单个凸优化问题。仿真实验结果表明,在传感器数为12的情况下,相较于基于粒子群算法的遍历搜索机制,所提机制在仅损失约4.73%的总能效的情况下将运算时间降低了5个数量级。
环境、社会及治理(ESG)指标是评估企业可持续发展的重要指标。现有的ESG评估体系存在覆盖范围狭窄、主观性强和时效性差等问题,因此,迫切需要研究能利用企业数据准确预测ESG指标的预测模型。针对企业数据中ESG关联特征存在信息丰度不一致的问题,提出一种基于丰度协调技术的企业ESG指标预测模型RCT (Richness Coordination Transformer),其中上游丰度协调模块通过自编码器协调异质丰度特征,从而提高下游模块的ESG指标预测性能。在真实数据集上的实验结果表明,与模型时间卷积网络(TCN)、长短期记忆(LSTM)网络、自注意力模型(Transformer)、极限梯度提升(XGBoost)和轻量级梯度提升机(LightGBM)相比,RCT模型在各项预测指标上均表现最优,验证了RCT模型在预测ESG指标上的有效性和优越性。
针对交通路口图像复杂,小目标难测且目标之间易遮挡以及天气和光照变化引发的颜色失真、噪声和模糊等问题,提出一种基于YOLOv9(You Only Look Once version 9)的交通路口图像的多目标检测算法ITD-YOLOv9(Intersection Target Detection-YOLOv9)。首先,设计CoT-CAFRNet (Chain-of-Thought prompted Content-Aware Feature Reassembly Network)图像增强网络,以提升图像质量,并优化输入特征;其次,加入通道自适应特征融合(iCAFF)模块,以增强小目标及重叠遮挡目标的提取能力;再次,提出特征融合金字塔结构BiHS-FPN (Bi-directional High-level Screening Feature Pyramid Network),以增强多尺度特征的融合能力;最后,设计IF-MPDIoU (Inner-Focaler-Minimum Point Distance based Intersection over Union)损失函数,以通过调整变量因子,聚焦关键样本,并增强泛化能力。实验结果表明,在自制数据集和SODA10M数据集上,ITD-YOLOv9算法的检测精度分别为83.8%和56.3%,检测帧率分别为64.8 frame/s和57.4 frame/s。与YOLOv9算法相比,ITD-YOLOv9算法的检测精度分别提升了3.9和2.7个百分点。可见,所提算法有效实现了交通路口的多目标检测。
代码复用为软件开发带来便利的同时也引入了安全风险,如加速漏洞传播、代码恶意抄袭等,代码相似性检测技术通过分析代码间词法、语法、语义等信息计算代码相似程度,是判断代码复用最有效的技术之一,也是近年发展较快的程序安全分析技术。首先,系统梳理代码相似性检测的近期技术进展,根据目标代码是否开源,将代码相似性检测技术分为源码相似性检测和二进制代码相似性检测,又根据编程语言、指令集的不同进行二次细分;其次,总结每一种技术的思路和研究成果,分析机器学习技术在代码相似性检测领域成功的案例,并讨论现有技术的优势与不足;最后,给出代码相似性检测技术的发展趋势,为相关研究人员提供参考。
机器学习依托数据建模与特征识别技术构建社会风险预测模型,赋能防控体系智能决策。然而,欺诈检测任务因正负样本数量严重不平衡导致传统方法效果受限,在极端不平衡的情况下,即便模型将所有交易预测为正常交易,准确率仍可高达99%以上,但欺诈交易的检出率却接近零;且单一模型仅能捕捉特定维度的欺诈特征,难以全面预测多种欺诈模式。因此,提出ContraStacker集成方法,突破数据不平衡限制,弥补单一模型的局限,精准识别多种欺诈模式,提升欺诈交易检出率。ContraStacker通过过采样、欠采样及其组合策略平衡数据分布,构建多风险预警器,并在Stacking框架中引入对比损失函数,深度融合模型预测结果与原始特征,增强模型泛化能力,成功应对极端不平衡的欺诈检测挑战。实验结果表明,ContraStacker在多个欺诈检测数据集上有效降低了误报率(FPR)(将正常交易预测为欺诈交易的比例),同时保持较低的漏检率(FNR)(将欺诈交易预测为正常交易的比例),在金融交易安全中具备应用潜力。
针对皮肤病灶边界模糊、存在毛发干扰、病灶大小不一等问题,提出一种基于双路径注意力机制和多尺度信息融合的皮肤病灶分割网络。首先,在编码器部分设计基于深度可分离卷积的残差门控注意力模块DGConv(Depthwise Gate Convolution),用于捕捉病灶区域的局部信息;其次,在网络瓶颈处设计多尺度上下文关系提取模块(MCEM),采用水平平均池化及垂直平均池化建模上下文信息,并融合残差空洞卷积金字塔模块捕获的多尺度特征进一步增强对病灶全局信息的理解;再次,在跳跃连接处设计双路径注意力模块用于细化病灶信息,并利用多尺度特征融合增强(MSFE)模块实现多阶段信息的交融,丰富当前阶段传输的细节特征信息;最后,在解码器部分设计特征融合模块(FM),以解决同阶段接受野失配的问题,并逐步融合编码器输出和跳跃连接传递的特征信息得到最终的分割结果。该网络在ISIC2017(International Skin Imaging Collaboration)和ISIC2018数据集上的实验结果表明,相较于皮肤病灶分割方面表现次优的网络,所提网络的Dice指标分别提高了0.09和1.09个百分点,交并比(IoU)指标分别提高0.14和1.76个百分点;与经典U-Net相比,Dice指标分别提高5.13和3.84个百分点,IoU指标分别提高了7.74和6.04个百分点。充分说明所提网络的先进性与有效性。
针对时间序列分段后存在因采样间隔增大而导致的长期预测过程中局部依赖关系丢失的情况,提出一种基于分段注意力机制的时间序列预测模型(SAMformer)。首先,显式地将时间静态协变量与原始数据按比例融合,以增强数据的时域信息表征能力;其次,同时引入两个连续的带偏置的线性层和一个激活函数来微调融合数据,从而提高模型对非线性数据的拟合能力;然后,在分段序列的每个段内引入点积注意力机制,以便捕获局部特征依赖关系;最后,利用跨尺度依赖的编码器-解码器架构预测时序数据。所提模型在公开的5个时间序列数据集上的实验结果表明,相较于Crossformer、 Pyraformer和Informer等其他监督学习时序预测模型,SAMformer的均方误差(MSE)和平均绝对误差(MAE)分别降低了2.0%~62.0%和0.9%~49.8%。此外,通过消融实验验证了所提不同组件的完备性和有效性,进一步说明了融合时域信息和段内注意力机制有助于提高时间序列预测的精度。
作为电力系统的核心输配电载体,高压输电线路的运行状态直接关系到电网安全。针对传统人工巡检效率低和漏检率高的问题,提出一种基于两阶段多模态注意力机制与动态特征解耦的轻量化输电线路缺陷检测方法。在第一阶段,基于改进型轻量检测网络Light-YOLO实现关键组件的精准定位;在第二阶段,构建基于双分支对比学习的缺陷检测网络Dual-DifferNet实现缺陷的精确分类与识别。在Light-YOLO的设计中,引入分层可分离视觉Transformer(SepViT)与深度可变形卷积网络(DCN)的混合结构,并通过交替堆叠局部感知卷积层与全局注意力Transformer块,在降低计算量的同时,增强模型对长程依赖关系的建模能力,从而有效提升绝缘子和导线接头等小目标的检测精度。针对缺陷分类任务,Dual-DifferNet采用双分支结构在每个分支中嵌入空间-通道双重注意力(SCDA)模块,利用交叉注意力机制促进双模态特征交互,从而提高缺陷识别的鲁棒性与泛化能力。实验结果表明,所提方法的平均精度均值(mAP@50)达到了96.9%,较基准模型YOLOv8提升16.1个百分点,同时浮点运算量降低了56.73%,充分验证了该方法在保证高精度检测的同时,具备优异的计算效率与部署潜力。
随着无线通信技术和高精度移动定位技术的发展,车联网(IoV)已深度融入人们的日常生活中。IoV在为人们带来便利的同时,也带来了隐私风险。通常,在IoV中,车辆行驶信息与其他车辆信息和基础设施信息进行实时交互。而在交互过程中,可能会产生敏感信息泄露等隐私问题。首先,对IoV的位置隐私架构和隐私风险进行介绍;其次,介绍差分隐私的动态分配噪声机制、多维度差分隐私轨迹保护及数据扰动技术;再次,对基于匿名化的空间泛化和K匿名以及加密机制的非对称加密、对称加密和同态加密进行介绍;最后,从差分隐私、匿名及加密机制的优缺点和局限性等方面加以分析与评价。
针对深海拍摄会导致水下图像色彩偏移、对比度过低和结构不清晰等问题,提出一种基于多尺度感知的多维空间融合水下图像增强算法,结合空间、通道和三维特征将图像信息并行传入多维特征提取网络和编码器中。首先,在多维特征提取网络中引入多尺度特征精炼模块进一步处理提取到的特征信息,使网络更准确地学习不同尺度的信息;然后,在编码器中引入多维色彩增强模块,增强图像细节和色彩;最后,设计自适应增强网络来进一步处理特征信息并融合多级信息,再通过解码器得到最终的增强图像。在公开数据集上的实验结果表明,所提算法表现优异,它的峰值信噪比(PSNR)和结构相似性(SSIM)最高分别达到24.865 1 dB和0.895 4,比混合融合方法(HFM)分别提升了1.580 6 dB和0.039 8;水下色彩质量评价(UCIQE)和水下图像质量测量(UIQM)最高分别达到0.593 1和3.102 8,比HFM分别提升了0.038 4和0.151 4。可见,所提算法能有效提升水下视觉效果。
可见光与热红外跟踪(又称RGBT(RGB-Thermal)跟踪)的核心是有效地利用不同模态的信息,针对决策级融合中单分支产生低质结果影响算法判定目标的问题,提出一个用于RGBT跟踪的孪生混合信息融合算法SiamMIF。首先,使用孪生主干网络(SBN)进行多模态特征提取;其次,从信噪比的角度分析低质图像对双分支并行决策产生的影响,进而设计了一个信噪比驱动的信息交互模块(IIM)对低信噪比特征进行信息互补;再次,利用双流无锚跟踪头(ADH)对补偿后的特征进行分类回归;最后,采用自适应轻量决策模块(ALDM)对跟踪结果进行融合,并快速判定目标位置。在4个RGBT基准数据集GTOT、RGBT234、VOT-RGBT2019和LasHeR上的实验结果表明,所提算法在LasHeR数据集上的成功率和精确度分别为0.396和0.518,相较于APFNet(Attribute-based Progressive Fusion Network)提升9.4%和3.6%,在其他3个数据集上也能取得较好结果,且在GPU上的帧率能达到40 frame/s。
多模态推荐旨在通过融合多模态信息增强用户和项目的特征表示,提升推荐性能。然而,现有方法存在跨模态语义信息融合不足、多模态特征冗余及噪声干扰问题。针对这些问题,提出一种基于语义融合和对比增强的多模态推荐方法(SFCERec)。首先,设计跨模态语义一致性增强框架,通过多模态语义特征筛选机制构建全局关联图,动态聚合多模态共性特征并抑制噪声传播;同时,提出多粒度属性解耦模块,从模态特征中分离粗粒度共性特征与用户行为驱动的细粒度特征,缓解特征冗余。其次,提出多层次对比学习范式,联合跨模态一致性对齐、用户行为相似性建模、项目语义关联性约束及显式?潜在特征互信息最大化这4类任务,通过对比学习强化表征的判别性。最后,进一步结合图扰动增强策略,以通过添加噪声与双重对比正则化,提升模型对稀疏数据与噪声干扰的鲁棒性。在Amazon-Baby、Amazon-Sports和Amazon-Clothing数据集上的实验结果表明,该方法在Recall@20和NDCG@20指标上均优于所有基线模型,尤其在稀疏场景下。消融实验结果也验证了该方法的有效性。
知识图谱从装备故障诊断数据中提取有用的知识,通过(实体,关系,实体)的三元组方式,对复杂装备的故障诊断信息进行有效管理,实现装备故障的快速诊断。首先,介绍装备故障诊断知识图谱的相关概念,分析装备故障诊断领域知识图谱的构建框架;其次,归纳国内外装备故障诊断知识图谱的知识抽取、知识融合以及知识推理等几个关键技术的研究现状;最后,对目前装备故障诊断知识图谱应用进行总结,提出该领域知识图谱构建的不足和面临的挑战,并对未来装备故障诊断领域提供一些新的思路。
在算力网络(CPN)中,用户设备(UE)因计算能力和电源容量受限,需要依赖外部算力节点协同处理任务。现有研究多集中于直接卸载工作流任务(WT)上,而面临着以下关键挑战:1)任务依赖导致的长等待时延和高能耗问题;2)当前驱任务数据需在UE上缓存时,UE长时间处于高功耗状态;3)CPN动态环境下资源状态的不确定性增加了卸载决策的复杂性;4)任务完成时间与能耗之间的多目标冲突,导致难以实现高效平衡。针对这些问题,提出一种基于动态任务优化与卸载(DOOWT)的节能优化方法。该算法通过工作流结构优化(WSO)算法对任务图进行重排,以减少任务间的等待时延,从而降低整体能耗;结合基于深度确定性策略梯度(DDPG)的动态任务卸载(DBTO)算法实时调整卸载策略,从而有效提升CPN的计算性能和资源利用效率。实验结果表明,与随机卸载(Random)传统方法相比,所提方法的WT等待时延减少了60%,平均WT完成时延缩短了79%,整体能耗降低了82%。可见,该方法为能耗敏感型任务的优化与调度提供了理论支持与技术参考。
针对现有的基于深度学习的源代码漏洞检测方法存在目标代码语法和语义缺失严重以及神经网络模型对目标代码图点(边)权重分配不合理等问题,提出一种基于代码属性图(CPG)与自适应图卷积网络(AT-GCN)的源代码漏洞检测方法VulATGCN。该方法使用CPG对源代码进行表征,结合CodeBERT进行节点向量化,并通过图中心性分析提取深层次结构特征,从而多维度地捕捉代码的语法和语义信息。之后,结合Transformer自注意力机制善于捕捉长距离依赖关系和图卷积网络(GCN)善于捕捉局部特征的优势设计AT-GCN模型,从而实现对不同重要性区域特征的融合学习和精确提取。在真实漏洞数据集Big-Vul和SARD上的实验结果表明,所提方法VulATGCN的平均F1分数达到了82.9%,相较于VulSniper、VulMPFF和MGVD等基于深度学习的漏洞检测方法提高了10.4%~132.9%,平均提高约52.9%。
在协同融合气象、空间和时间三大信息的时空混合模型中,时间变化建模通常在一维空间中完成。针对一维序列局限于滑动窗口和缺乏对多尺度特征的灵活提取的问题,提出一种多域时空层次图神经网络(MST-HGNN)模型。首先,构建城市全局尺度和站点局部尺度的两级层次图,从而进行空间关系学习;其次,将一维空气质量序列转换为一组基于多个周期的二维张量,并在二维空间上通过多尺度卷积进行周期解耦以捕获频域特征;同时,在一维空间中利用长短期记忆(LSTM)网络拟合时域特征;最后,为避免聚合冗余信息,设计一种门控机制融合模块用于频域和时域特征的多域特征融合。在Urban-Air数据集和长三角城市群数据集上的实验结果表明,相较于多视图多任务时空图卷积网络模型(M2),所提模型在预测第1 h、3 h、6 h、12 h空气质量的平均绝对误差(MAE)和均方根误差(RMSE)均低于对比模型。可见,MST-HGNN能在频域上解耦复杂时间模式,利用频域信息弥补时域特征建模的局限性,并结合时域信息更全面地预测空气质量变化。
现有睡眠监测研究主要是针对睡眠质量提出非干扰式监测方法的研究,而缺乏对睡眠质量主动调节方法的研究。基于心率变异性(HRV)分析的精神状态以及睡眠分期研究主要集中在这两种信息的获取上,而这两种信息的获取需要佩戴专业医疗设备,并且这些研究缺乏对信息的应用以及调整。音乐可以作为一种解决睡眠问题的非药物类方法,但现有音乐推荐方法并未考虑个体睡眠及精神状态的差异。针对以上问题提出了一种基于移动设备的精神压力和睡眠状态的音乐推荐系统。首先,用手表采集光体积扫描计信号来提取特征并计算心率;其次,将采集的信号通过蓝牙传递给手机,手机通过这些信号评估人的精神压力以及睡眠状态来播放调整音乐;最后,根据个体每晚的入眠时间进行音乐推荐。实验结果表明,在使用睡眠音乐推荐系统后,用户睡眠总时长相较于使用前增长11.0%。
针对现有的基于对比学习的序列推荐模型只考虑了项目和项目或者序列和序列这一个层级的表示学习,而没有办法学习到精细的、易于区分的用户与项目表示的问题,提出一种基于多层次图对比学习的序列推荐(MLGCL-SR)模型。首先,根据用户点击项目的顺序构建项目转移图,并对它进行嵌入表示;其次,利用优化后的双向门控图神经网络(BI-GGNN)在嵌入的项目转移图上进行用户的表示学习;最后,对主要推荐预测任务通过交叉熵损失函数进行参数更新,并使用多层次对比学习任务在嵌入层、节点层、序列层三个层次辅助推荐预测任务进行参数更新,其中在嵌入层和节点层辅助推荐预测任务进行更好的项目表示,而在序列层辅助推荐预测任务进行更好的用户表示。在3个基准数据集Sports、Beauty、Toys上的实验结果表明,相较于对比的最优模型MCLRec (Meta-optimized Contrastive Learning for sequential Recommendation),MLGCL-SR模型在命中率(HR)和归一化折损累计增益(NDCG)指标上有了显著的提升,在能较好反映推荐效果的NDCG@10指标上分别提升了14.2%、19.1%和23.1%,验证了模型的有效性。
针对中药材粉末的显微图像中含有大量细微特征和背景干扰因素导致的同一类药材的变化过大(类内差异大)和多种药材之间特征过于相似(类间差异小)的问题,提出一种多尺度2D-Adaboost算法。首先,构建一个全局?局部特征融合的主干网络架构,以更好地提取多尺度特征,该架构通过结合Transformer和卷积神经网络(CNN)的优势能有效提取并融合各个尺度的全局和局部特征,从而显著提高主干网络的特征捕捉能力;其次,将Adaboost的单尺度输出拓展到多尺度,并构建2D-Adaboost结构的背景抑制模块,该模块将主干网络各个尺度的输出特征图划分为前景和背景,从而有效抑制背景区域的特征值,并增加判别性特征的强度;最后,在2D-Adaboost结构的每个尺度上额外添加一个分类器以构建特征细化模块,该模块通过控制温度参数协调分类器间的协作学习,从而逐步细化不同尺度的特征图,帮助网络学习更合适的特征尺度,并丰富细节特征的表示。实验结果表明,所提算法的识别准确率达到了96.85%,与ConvNeXt-L、ViT-L、Swin-L和Conformer-L模型相比分别上升了7.56、5.26、3.79和2.60个百分点。高准确率和分类效果的稳定性验证了所提算法在中药材粉末显微图像分类任务中的有效性。
针对大语言模型(LLM)快速发展导致智能生成文本信息高度拟真、传统检测方法性能下降的问题,提出一种基于多特征自适应融合的智能生成文本检测方法。该方法首先构建涵盖文本统计特征、语言结构性特征及语言不确定性特征的语言风格特征集,捕捉真实文本与生成文本的差异;再利用独立编码技术提取文本的深层语义特征。在此基础上,设计一种双路映射特征自适应融合策略,先将语言风格特征与深层文本语义特征初步融合,再基于深度学习方法进行二次融合,增强特征自适应融合能力。实验结果表明:所提方法在中文SocialAI-Detect数据集与英文TuringBench数据集上的检测准确率分别达到98.1%和98.5%,与基线方法中性能表现最好的J-Guard(Journalism Guided adversarially robust detection of AI-generated news)相比,分别提升了2.3与2.1个百分点,验证了所提方法的有效性。
随着人工智能的快速发展,用户隐私泄露风险日益严重。差分隐私是一种关键的隐私保护技术,通过在数据中引入噪声防止个人信息泄露,而联邦学习(FL)则允许在不交换数据的情况下共同训练模型,保护数据的安全性。近年来,差分隐私技术与FL的结合使用可以充分发挥它们各自的优势:差分隐私确保数据使用过程中的隐私保护,而FL则通过分布式训练提高模型的泛化能力和效率。针对FL的隐私安全问题,首先,系统性地总结和比较基于差分隐私的FL的最新研究进展,包括不同的差分隐私机制、FL算法和应用场景;其次,重点讨论差分隐私在FL中的应用方式,包括数据聚合、梯度下降和模型训练等方面,并分析各种技术的优缺点;最后,详细总结该领域当前存在的挑战和发展方向。
针对知识推理模型在捕获实体之间的复杂语义特征方面难以捕捉多层次语义信息,同时未考虑单一路径的可解释性对正确答案的影响权重不同等问题,提出一种融合路径与子图特征的知识图谱(KG)多跳推理模型PS-HAM (Hierarchical Attention Model fusing Path-Subgraph features)。PS-HAM将实体邻域信息与连接路径信息进行融合,并针对不同路径探索多粒度的特征。首先,使用路径级特征提取模块提取每个实体对之间的连接路径,并采用分层注意力机制捕获不同粒度的信息,且将这些信息作为路径级的表示;其次,使用子图特征提取模块通过关系图卷积网络(RGCN)聚合实体的邻域信息;最后,使用路径-子图特征融合模块对路径级与子图级特征向量进行融合,以实现融合推理。在两个公开数据集上进行实验的结果表明,PS-HAM在指标平均倒数秩(MRR)和Hit@k (k=1,3,10)上的性能均存在有效提升。对于指标MRR,与MemoryPath模型相比,PS-HAM在FB15k-237和WN18RR数据集上分别提升了1.5和1.2个百分点。同时,对子图跳数进行的参数验证的结果表明,PS-HAM在两个数据集上都在子图跳数在3时推理效果达到最佳。
针对智能交通系统中车辆轨迹异常检测的复杂性和动态性,提出一种基于多层次时空交互依赖的动态图(MSTIDG)的车辆轨迹异常检测方法DSTGRU(Dynamic Spatio-Temporal Gated Recurrent Unit)。DSTGRU通过构建短期和长期时空交互依赖的动态图,有效地捕捉车辆间的复杂交互关系。在这个过程中,引入多层次时空交互特征融合(MSF-BiGRU)模块融合多层次时空特征,以在不同尺度上融合时空信息,从而缓解共享信息提取时的冲突并增强模型的鲁棒性,进而提升对异常轨迹的识别能力。实验结果表明,DSTGRU在TrackRisk和HighD数据集上的异常检测精度显著优于现有方法DiffTAD与ImDiffusion,Pre@100分别达到了0.90和0.89,AUROC分别达到了0.913和0.827。与现有方法对比,DSTGRU在多项评价指标上均排名第一。此外,DSTGRU在复杂场景中表现出较强鲁棒性,并能准确识别异常行为,为智能交通系统中的轨迹异常检测提供了解决方案。
多变量时间序列(MTS)数据具有高维性,且分布复杂多变,现有的异常检测模型在面对MTS数据集时普遍存在误判率高、训练困难等问题,且多数模型仅考虑时间序列样本的时空特征,对时间序列特征的学习并不全面。为了解决以上问题,提出一种基于多域特征提取的MTS异常检测模型(MFE-TS)。首先,从原始数据域出发,使用长短期记忆(LSTM)网络与卷积神经网络(CNN)分别提取MTS的时间相关性和空间相关性特征。其次,用傅里叶变换将原始时间序列转换到频域空间,并利用Transformer学习数据在频域空间的幅度与相位特征。多域特征学习能更全面地建模时间序列特征,从而提高模型对MTS的异常检测性能。此外,引入掩码策略,进一步增强模型的特征学习能力,并使模型具备一定的抗噪性。实验结果表明,MFE-TS在多个真实MTS数据集上展现了优越的性能,同时在含有噪声的数据集中仍能保持较好的检测效果。
近年来,利用文本、视觉和音频数据分析视频中说话者情感的多模态情感分析(MSA)引起了广泛关注。然而,不同模态在情感分析中的贡献大不相同。通常,文本中包含的信息更加直观,因此寻求一种用于增强文本在情感分析中作用的策略显得尤为重要。针对这一问题,提出一种跨模态文本信息增强的多模态情感分析模型(MSAM-CTE)。首先,使用BERT(Bidirectional Encoder Representations from Transformers)预训练模型提取文本特征,并使用双向长短期记忆(Bi-LSTM)网络对预处理后的音频和视频特征进行进一步处理;其次,通过基于文本的交叉注意力机制,将文本信息融入情感相关的非语言表示中,以学习面向文本的成对跨模态映射,从而获得有效的统一多模态表示;最后,使用融合特征进行情感分析。实验结果表明,与最优的基线模型——文本增强Transformer融合网络(TETFN)相比,MSAM-CTE在数据集CMU-MOSI (Carnegie Mellon University Multimodal Opinion Sentiment Intensity)上的平均绝对误差(MAE)和皮尔逊相关系数(Corr)分别降低了2.6%和提高了0.1%;在数据集CMU-MOSEI (Carnegie Mellon University Multimodal Opinion Sentiment and Emotion Intensity)上的两个指标分别降低了3.8%和提高了1.7%,验证了MSAM-CTE在情感分析中的有效性。
为了缩短数字孪生(DT)系统迭代和维护的时间,并降低DT系统的演进成本,探索将开发运维一体化(DevOps)方法论融入DT系统的潜力,并提出一种创新的DT系统DevOps(DTOps)实践。针对DT系统的特定需求和特性,设计面向服务的系统架构,提升系统的可扩展性与敏捷性,并给出DTOps的主要基础设施和持续集成(CI)以及持续交付(CD)的实现方法。在齿轮生产线的案例研究中,采用开源技术工具验证DTOps的各个环节,展示DTOps实现的可行性与便捷性。实验研究结果表明,DTOps相较于单体架构和微服务架构,演进效率分别提升了29.7%和26.9%,尤其在高度集成和数据密集的环境中效果显著,验证了DTOps在工程应用中的有效性。
网络流量异常检测是利用各种检测技术分析判断网络流量,发现网络中潜在的攻击,是一种有效的网络安全防护方法。针对高维海量数据和不同攻击类别的网络流量数据不均衡而导致检测准确率低、误报率高的问题,提出一种融合一维卷积神经网络(1D-CNN)和双向门控循环单元(BiGRU)的类不平衡流量异常检测模型。首先,针对类不平衡数据,通过使用改进的合成少数类过采样技术(SMOTE)即Borderline-SMOTE和基于高斯混合模型(GMM)的欠采样聚类技术进行平衡处理;然后,使用1D-CNN提取数据的局部特征,并利用BiGRU更好地提取数据中的时序特征;最后,在UNSW-NB15数据集对所提模型进行验证,所提模型的准确率为98.12%,误报率为1.28%。结果表明,所提模型提高了对少数攻击的识别率,检测精度高于其他经典机器学习和深度学习模型。