期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于位置编码重叠切块嵌入和多尺度通道交互注意力的鱼类图像分类
周雯, 谌雨章, 温志远, 王诗琦
《计算机应用》唯一官方网站    2024, 44 (10): 3209-3216.   DOI: 10.11772/j.issn.1001-9081.2023101466
摘要149)   HTML1)    PDF (2604KB)(38)    收藏

水下鱼类图像分类是一项极具挑战性的任务。传统Vision Transformer (ViT)网络骨干的局限性较大,难以处理局部连续特征,在图像质量较低的鱼类分类中效果表现不佳。为解决此问题,提出一种基于位置编码的重叠切块嵌入(OPE)和多尺度通道交互注意力(MCIA)的Transformer图像分类网络PIFormer (Positional overlapping and Interactive attention transFormer)。PIFormer采用多层级形式构建,每层以不同次数堆叠,利于提取不同深度的特征。首先,引入深度位置编码重叠切块嵌入(POPE)模块对特征图与边缘信息进行重叠切块,以保留鱼体的局部连续特征,并添加位置信息以排序,帮助PIFormer整合细节特征和构建全局映射;其次,提出MCIA模块并行处理局部与全局特征,并建立鱼体不同部位的长距离依赖关系;最后,由分组多层感知机(GMLP)分组处理高层次特征,以提升网络效率,并实现最终的鱼类分类。为验证PIFormer的有效性,提出自建东湖淡水鱼类数据集,并使用公共数据集Fish4Knowledge与NCFM(Nature Conservancy Fisheries Monitoring)以确保实验公平性。实验结果表明,所提网络在各数据集上的Top-1分类准确率分别达到了97.99%、99.71%和90.45%,与同级深度的ViT、Swin Transformer和PVT (Pyramid Vision Transformer)相比,参数量分别减少了72.62×106、14.34×106和11.30×106,浮点运算量(FLOPs)分别节省了14.52×109、2.02×109和1.48×109。可见,PIFormer在较少的计算负荷下,具有较强的鱼类图像分类能力,取得了优越的性能。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于深度学习的双通道夜视图像复原方法
牛康力, 谌雨章, 沈君凤, 曾张帆, 潘永才, 王绎冲
计算机应用    2021, 41 (6): 1775-1784.   DOI: 10.11772/j.issn.1001-9081.2020091411
摘要844)      PDF (1916KB)(761)    收藏
针对夜间场景光线微弱、能见度低导致夜视图像信噪比低、成像质量差的问题,提出了基于深度学习的双通道夜视图像复原方法。首先,用两种基于全连接多尺度残差学习分块(FMRB)的卷积神经网络(CNN)分别对红外夜视图像和微光夜视图像进行多尺度特征提取和层次特征融合,从而得到重建的红外图像和增强的微光图像;然后,两种处理后的图像通过自适应加权平均算法进行融合,并根据场景的不同自适应地凸显两个图像中具有更高显著性的有效信息;最后,得到分辨率高且视觉效果好的夜视复原图像。使用基于FMRB的深度学习网络得到的红外夜视重建图像,相较于卷积神经网络超分辨率(SRCNN)重建算法得到的在峰值信噪比(PSNR)和结构相似性(SSIM)的平均值上分别提升了3.56 dB和0.091 2;相较于MSRCR,得到的微光夜视增强图像在PSNR和SSIM的平均值上分别提升了6.82 dB和0.132 1。实验结果表明,所提方法得到的重建图像的清晰度明显得到改善,获得的增强图像的亮度也明显得到提升,而且前二者的融合图像的视觉效果较好,可见所提方法能有效改善夜视图像的复原效果。
参考文献 | 相关文章 | 多维度评价
3. 基于深度学习的水下图像超分辨率重建方法
陈龙彪, 谌雨章, 王晓晨, 邹鹏, 胡学敏
计算机应用    2019, 39 (9): 2738-2743.   DOI: 10.11772/j.issn.1001-9081.2019020353
摘要690)      PDF (893KB)(565)    收藏

由于水体本身的特性以及水中悬浮颗粒对光的吸收和散射作用,水下图像普遍存在信噪比(SNR)低、分辨率低等一系列问题,但大部分方法传统处理方法包含图像增强、复原及重建,都依赖退化模型,并存在算法病态性问题。为进一步提高水下图像恢复算法的效果和效率,提出了一种改进的基于深度卷积神经网络的图像超分辨率重建方法。该方法网络中引入了改良的密集块结构(IDB),能在有效解决深度卷积神经网络梯度弥散问题的同时提高训练速度。该网络对经过配准的退化前后的水下图像进行训练,得到水下低分辨率图像和高分辨率图像之间的一个映射关系。实验结果表明,在基于自建的水下图像作为训练集上,较卷积神经网络的单帧图像超分辨率重建算法(SRCNN),使用引入了改良的密集块结构(IDB)的深度卷积神经网络对水下图像进行重建,重建图像的峰值信噪比(PSNR)提升达到0.38 dB,结构相似度(SSIM)提升达到0.013,能有效地提高水下图像的重建质量。

参考文献 | 相关文章 | 多维度评价