提取准确的边缘信息对分割建筑物至关重要。将多尺度细节与语义特征进行简单融合,或者设计复杂的损失函数引导网络关注边缘信息是当前较常见的方法,然而这些方法很少关注语义和细节特征的相互促进作用。针对该问题,提出一种基于语义和细节特征双促进的遥感影像建筑物提取网络。所提网络的结构类似U-Net框架,在编码端提取浅层高分辨率细节特征图,在解码端将深层的语义与细节特征双促进模块(SDFF)嵌入主干网络中,从而使网络同时具备较好的语义特征和细节特征的提取能力。之后对语义和细节特征进行通道融合,并结合不同分辨率影像的边缘损失监督,提高网络对建筑物细节的提取能力和泛化性。实验结果表明:与U-Net和双路细节关注网络(DSDCNet)等多种主流方法相比,所提网络在WHU数据集和马萨诸塞州建筑物(Massachusetts)数据集上均取得了最佳的语义分割结果。可见,所提网络能更好地保留建筑物边缘特征,有效提升遥感影像中的建筑物分割精度。
针对状态预测误差直接作为内在好奇心奖励,在状态新颖性与奖励相关度低的任务中强化学习智能体不能有效探索环境的问题,提出一种基于奖励预测误差的内在好奇心模块(RPE-ICM)。RPE-ICM利用奖励预测误差网络(RPE-Network)学习并修正状态预测误差奖励,并将奖励预测误差(RPE)模型的输出作为一种内在奖励信号去平衡探索过度与探索不足,使得智能体能够更有效地探索环境并利用奖励去学习技能,从而达到更好的学习效果。在不同的MuJoCo环境中使用RPE-ICM、内在好奇心模块(ICM)、随机蒸馏网络(RND)以及传统的深度确定性策略梯度(DDPG)算法进行对比实验。结果表明,相较于传统DDPG、ICM-DDPG以及RND-DDPG,基于RPE-ICM的DDPG算法的平均性能在Hopper环境中分别提高了13.85%、13.34%和20.80%。