遥感图像中目标尺度变化大且目标长宽比差异大,导致遥感图像目标检测困难。针对遥感图像的这一特点,通过改进YOLO框架,提出EW-YOLO(Efficient Weighted-YOLO)提高遥感图像目标检测的精度。首先,在特征融合部分,设计多级特征融合结构,以利用双分支的残差模块促进不同尺度特征的融合,并通过融合模块的级联以及跨层特征的融合设计,增强对不同尺度目标的提取能力,并进一步增强检测能力;其次,在预测部分,提出加权检测头,引入加权检测框融合(WBF),以利用置信度分数对每个候选框进行加权,并融合生成预测框,从而提高不同长宽比目标的检测精度;最后,针对图像尺寸过大的问题,提出图像重采样处理方法,即通过将图像采样至合适大小并参与网络训练,解决由于切割造成的大尺寸目标检测精度较低的问题。在DOTA数据集上进行的实验的结果表明,所提方法的检测平均精度均值(mAP)达到了77.47%,较基于原始YOLO框架的方法提升了1.55个百分点,且优于目前的主流方法。同时,也在HRSC和UCAS-AOD数据集上验证了所提方法的有效性。
针对当前会话推荐中存在对于当前会话的项目转换信息挖掘不充分且极少利用其他会话信息的问题,提出一种基于图神经网络的多层信息交互融合算法用于会话推荐。基于当前会话,首先,对节点之间的连接关系设计不同的权重聚合邻域节点的信息,并挖掘当前会话中项目转换的显性信息;其次,通过基于堆叠的残差图注意力网络聚合邻域节点信息,挖掘当前会话中项目转换的隐性信息;最后,通过单门控图神经网络挖掘基于时间戳的会话中存在的序列依赖信息。基于其他会话,通过节点的一阶邻居将整个会话集联系起来,学习全局信息编码,进而融合4个层次的嵌入表示以获得更全面的项目转换信息,同时使用软注意力机制和反向位置嵌入信息对获得的项目转换信息进行更有效的融合。实验结果表明,在Diginetica数据集上,所提模型的精度P@20和平均倒数排名MRR@20较次优模型GCE-GNN(Global Context Enhanced Graph Neural Network)分别提升了0.79%和0.84%;在Tmall数据集上,所提模型的P@20和MRR@20较次优模型HyperS2Rec分别提升了8.23%和7.86%;在Nowplaying数据集上,所提模型的P@20和MRR@20较次优模型HyperS2Rec分别提升了1.33%和7.16%。
社区搜索的目标是从数据图中得到包含查询顶点的紧密子图,在社会学、生物学等领域有着广泛应用。针对现有基于子图连通性的社区模型的基础连通结构都是完全连通图,无法满足实际应用中用户对社区结构多样性的需求的问题,提出一种基于motif连通性的社区搜索方法,其中包括基于motif连通性的社区(MCC)模型以及两个相应的社区搜索算法——MPCS (Motif-Processed Community Search)算法和基于MP-index的社区搜索算法。MCC模型可以协助用户自由指定社区的基础连通结构,MPCS算法可以用来解决MCC的搜索问题。此外,提出两个分别针对motif实例搜索过程及所属社区判断过程的剪枝优化技术。最后,设计了MP-index以避免社区搜索过程中的冗余遍历操作。在多个真实数据集上进行实验的结果表明:剪枝优化可以使MPCS算法的耗时减少60%~85%,而基于MP-index的社区搜索算法相较于加入剪枝优化的MPCS算法,效率提升普遍达到了2~3个数量级。可见,所提方法在商品推荐和社交网络等问题上有着实际应用价值。
目前有监督的人脸伪造视频检测方法需要大量标注数据。为解决视频伪造方法迭代快、种类多等现实问题,将时序异常检测中的无监督思想引入人脸伪造视频检测,将伪造视频检测任务转为无监督的视频异常检测任务,提出一种基于重构误差的无监督人脸伪造视频检测模型。首先,抽取待检测视频中连续帧的人脸特征点序列;其次,基于偏移特征、局部特征、时序特征等多粒度信息对待检测视频中人脸特征点序列进行重构;然后,计算原始序列与重构序列之间的重构误差;最后,根据重构误差的波峰频率计算得分对伪造视频进行自动检测。实验结果表明,在FaceShifter、FaceSwap等人脸视频伪造方法上,与LRNet (Landmark Recurrent Network)、Xception-c23等检测方法相比,所提方法的检测性能的曲线下方面积(AUC)最多增加了27.6%,移植性能的AUC最多增加了30.4%。
针对基于循环神经网络(RNN)的人体运动合成方法存在首帧跳变,进而影响生成运动的质量的问题,提出一种带有隐状态初始化的人体运动合成方法,将初始隐状态作为自变量,利用神经网络的目标函数作为优化目标,并使用梯度下降的方法进行优化求解,以得到一个合适的初始隐状态。相较于编码器-循环-解码器(ERD)、残差门控循环单元(RGRU)模型,所提方法在首帧的预测误差分别减小63.51%和6.90%,10帧的总误差分别减小50.00%和4.89%。实验结果表明,该方法无论是运动合成质量还是运动预测精度都优于不进行初始隐状态估计的方法;它通过准确估计基于RNN的人体运动模型的首帧隐状态可提升运动合成的质量,并且为实时安全监测中的动作识别模型提供可靠的数据支持。
准确的交通流量预测在帮助交通管理部门采取有效的交通控制和诱导手段以及帮助出行者合理规划路线等方面具有重要意义。针对传统深度学习模型对交通数据时空特性考虑不足的问题,在卷积神经网络(CNN)和长短时记忆(LSTM)单元的理论框架下,结合城市交通流量的时空特性,建立了一种基于注意力机制的CNN-LSTM预测模型——STCAL。首先,采用细粒度的网格划分方法来构建交通流量的时空矩阵;其次,利用CNN模型作为空间组件来提取城市交通流量不同时期下的空间特性;最后,利用基于注意力机制的LSTM模型作为动态时间组件来捕获交通流量的时序特征和趋势变动性,并实现交通流量的预测。实验结果表明,STCAL模型与循环门单元(GRU)和时空残差网络(ST-ResNet)相比,均方根误差(RMSE)指标分别减小了17.15%和7.37%,均绝对误差(MAE)指标分别减小了22.75%和9.14%,决定系数(R2)指标分别提升了11.27%和2.37%。同时,发现该模型在规律性较高的工作日的预测效果好于周末,且对工作日早高峰的预测效果最好,可见该模型可为短时城市区域交通流量变化监测提供依据。
影响力最大化是社交网络分析中的一个重要问题,旨在挖掘可以使得信息在网络中传播范围最大化的一小组节点(通常称为种子节点)。基于网络拓扑结构的启发式影响力最大化算法通常仅考虑某单一的网络中心性,没有综合考虑节点特性和网络拓扑结构,导致其效果受网络结构的影响较大。为了解决上述问题,提出了一种融合覆盖范围和结构洞的影响力最大化算法NCSH。该算法首先计算所有节点的覆盖范围和网格约束系数;然后通过覆盖范围增益最大原则选择种子节点;其次,若存在多个节点增益相同,则按照网格约束系数最小原则选取;最后,重复上述步骤直至选出所有种子节点。NCSH在不同种子数量和不同传播概率条件下,在六个真实网络数据集上均保持着优异的效果,在影响力传播范围方面,比同类的基于节点覆盖范围的算法(NCA)平均提高了3.8%;在时间消耗方面,比同类的基于结构洞和度折扣的最大化算法(SHDD)减少了43%。实验结果表明,NCSH能有效解决影响力最大化问题。
近年来基于锚点的三维手部姿态估计方法比较流行,A2J(Anchor-to-Joint)是比较有代表性的方法之一。A2J在深度图上密集地设置锚点,利用神经网络预测锚点到关键点的偏差以及每个锚点的权重。A2J使用预测的偏差和权重,以加权求和的方式计算关键点的坐标,降低了网络回归结果中的噪声。虽然A2J简单高效,但是不恰当的网络结构和损失函数影响了网络的准确度,因此提出改进的网络HigherA2J。首先,使用一个分支预测锚点到关键点的XYZ偏差,更好地利用深度图的3D特性;其次,简化A2J的网络分支结构从而降低网络参数量;最后,设计关键点估计损失函数,结合关键点估计损失和偏差估计损失,有效提高估计准确度。在三个数据集NYU、ICVL和HANDS 2017上的实验结果显示,手部姿态估计的平均误差比A2J都有所降低,分别降低了0.32 mm,0.35 mm和0.10 mm。
针对卷积结构的深度学习模型在小样本学习场景中泛化性能较差的问题,以AlexNet和ResNet为例,提出一种基于小样本无梯度学习的卷积结构预训练模型的性能优化方法。首先基于因果干预对样本数据进行调制,由非时序数据生成序列数据,并基于协整检验从数据分布平稳性的角度对预训练模型进行定向修剪;然后基于资本资产定价模型(CAPM)以及最优传输理论,在预训练模型中间输出过程中进行无需梯度传播的正向学习并构建一种全新的结构,从而生成在分布空间中具有明确类间区分性的表征向量;最后基于自注意力机制对生成的有效特征进行自适应加权处理,并在全连接层对特征进行聚合,从而生成具有弱相关性的embedding向量。实验结果表明所提出的方法能够使AlexNet和ResNet卷积结构预训练模型在ImageNet 2012数据集的100类图片上的Top-1准确率分别从58.82%、78.51%提升到68.50%、85.72%,可见所提方法能够基于小样本训练数据有效提高卷积结构预训练模型的性能。
多控制器软件定义网络(SDN)中交换机迁移策略单一,造成迁移效率低且多次迁移。为此,提出一种基于改进型拍卖的交换机迁移机制PASMM,将交换机的迁移问题优化成为控制器剩余资源的拍卖问题,通过提高处于供不应求状态的控制器资源的交易价格,完成拍卖过程,实现控制器和交换机的重新部署,提高网络效益。仿真实验表明,与典型的交换机迁移策略相比,PASMM达到了较好的控制器负载均衡,PACKET_IN消息的响应时间减少了约13.5%,同时随着交换机流请求的增大,PASMM的迁移时间最少。
针对有效圆域提取不准确以及传统柱面投影校正法在垂直方向上校正视场角不能达到180°的问题,分别提出了变角度线扫描法和纵向压缩柱面投影校正法.前者通过不断改变扫描线的倾斜角来寻找切点坐标,并对无效切点进行滤除,然后使用Kasa圆拟合法求取有效圆域的参数.后者则对传统柱面投影的光路进行了人为的弯折,从而把投影到无穷远点的光线压缩回柱面上,保留了图像有效信息.通过与经纬映射校正法以及墨卡托投影法的实验处理结果对比,纵向压缩柱面投影法能弱化校正图像边缘的拉伸模糊效应,使处理结果更加自然.
网络虚拟化的关键问题是虚拟网映射,能耗开销的快速增长使得节能成为底层设施供应商关注的目标。针对虚拟网映射中的节能问题,提出一种集中使用网络拓扑的节能虚拟网映射算法。该算法引入接近度中心度概念和节点能力共同表征节点的重要程度,优先使用已工作节点进行资源整合使用,同时通过检验保证底层链路距离不会过长,有利于减少能耗和开销。实验仿真结果表明该算法在接受率达到70%、长期收益开销比达到75%的同时,使收益能耗比提高20%以上,与之前算法相比具有优势。
网络虚拟化是突破网络发展僵局的一项重要技术,而虚拟网络映射(VNE)是网络虚拟化的一个主要问题。提高底层网络资源的利用率和收益是虚拟网络映射的主要目标。针对底层网络支持路径分裂的情况,建立了整数线性规划(ILP)模型,并提出基于混合群智能优化的虚拟网络映射算法。该算法在兼顾映射开销和映射均衡性的基础上利用粒子群优化算法(PSO)和遗传算法(GA)迭代优化映射方案。仿真实验结果表明,与现有的主流研究成果相比,该算法显著地提高了底层网络长期平均运营收益与虚拟网络请求接受率。
针对有雾图像对比度差、能见度低的情况,结合HSI颜色空间特点,提出一种单幅图像去雾算法。首先,将有雾图像从RGB颜色空间转换到HSI颜色空间;然后,依据HSI颜色空间中色度、饱和度和亮度各分量受雾影响程度的差异,建立相应的去雾模型;最后,通过分析图像饱和度,得到饱和度模型中权重的取值范围,再对亮度模型中权重进行估计,从而实现去雾效果。与其他几种算法的实验结果比较表明,所提算法运算效率提高1倍左右。同时该算法能有效增强图像清晰度,能很好地运用于单幅图像去雾。