期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于自蒸馏视觉Transformer的无监督行人重识别
贾洁茹, 杨建超, 张硕蕊, 闫涛, 陈斌
《计算机应用》唯一官方网站    2024, 44 (9): 2893-2902.   DOI: 10.11772/j.issn.1001-9081.2024040425
摘要161)   HTML11)    PDF (2340KB)(40)    收藏

针对视觉Transformer(ViT)缺乏归纳偏置,导致在相对小规模的行人重识别数据上难以学习有意义的视觉表征的问题,提出一种基于自蒸馏视觉Transformer的无监督行人重识别方法。首先,利用ViT的模块化架构,即每个中间块生成的特征维度相同的特性,随机选择一个中间Transformer块并将它送入分类器以得到预测结果;其次,通过最小化随机选择的中间分类器输出与最终分类器输出分布之间的Kullback-Leibler散度,约束中间块的分类预测结果与最终分类器的结果保持一致,据此构建自蒸馏损失函数;最后,通过对聚类级对比损失、实例级对比损失和自蒸馏损失进行联合最小化,对模型进行优化。此外,通过从最终分类器向中间块提供软监督,有效地给ViT模型引入归纳偏置,进而有助于模型学习更鲁棒和通用的视觉表征。与基于TransReID的自监督学习(TransReID-SSL)相比,在Market-1501数据集上,所提方法的平均精度均值(mAP)和Rank-1分别提升1.2和0.8个百分点;在MSMT17数据集上,所提方法的mAP和Rank-1分别提升3.4和3.1个百分点。实验结果表明,所提方法能够有效提高无监督行人重识别的精度。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 改进的CloFormer模型与有序回归相结合的年龄评估方法
付帅, 郭小英, 白茹意, 闫涛, 陈斌
《计算机应用》唯一官方网站    2024, 44 (8): 2372-2380.   DOI: 10.11772/j.issn.1001-9081.2023081199
摘要28)   HTML5)    PDF (3667KB)(15)    收藏

现有的年龄评估方法通常采用基于卷积神经网络(CNN)的有序回归,然而在预测相邻年龄时,CNN难以捕获全局特征表示,进而导致预测精度的下降。为了解决该问题,提出一种新的将改进的CloFormer模型与有序回归相结合的年龄评估方法。相较于传统的基于CNN的有序回归,CloFormer在捕捉图像特征时能够利用自注意力机制更好地捕捉图像中不同区域之间的关系,从而更好地学习相邻年龄之间的特征差异。首先,优化CloFormer模型;然后,将优化后的CloFormer模型与有序回归相结合,以便更好地利用年龄序列信息,实现更精准的年龄预测;接着,通过端到端优化训练改进后的CloFormer模型和有序回归模型,更好地学习面部特征和年龄序列的关系;最后,在多个公开数据集上对比实验。实验结果表明,所提方法在CACD、AFAD、UTKFace数据集上的均方根误差(RMSE)分别为7.36、4.62、8.28,与基于CNN的有序回归(OR-CNN)、秩一致性有序回归模型(CORAL)等现有年龄评估方法相比,在CACD数据集上分别减小了0.25、0.05,在AFAD数据集上分别减小了0.18、0.03,在UTKFace数据集上分别减小了0.97、0.53,可见所提方法取得了较好的年龄评估结果。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于时空注意力的空间关联三维形貌重建
盖彦辛, 闫涛, 张江峰, 郭小英, 陈斌
《计算机应用》唯一官方网站    2024, 44 (5): 1570-1578.   DOI: 10.11772/j.issn.1001-9081.2023050651
摘要169)   HTML6)    PDF (2607KB)(746)    收藏

聚焦形貌恢复通过对场景深度和散焦模糊之间的潜在关系进行建模实现三维形貌重建。但现有的三维形貌重建网络无法有效利用图像序列的时序关联进行表征学习,因此,提出一种基于多景深图像序列空间关联特征的深度网络框架——三维空间相关水平分析模型(3D SCHAM)进行三维形貌重建。该模型不仅可以精确捕获单帧图像中聚焦区域到离焦区域的边缘特征,而且可有效利用不同图像帧之间的空间依赖性特征。首先,通过构建深度、宽度和感受野复合扩展的网络构造三维形貌重建的时域连续模型,进而确定单点深度结果;其次,引入基于空间关联的注意力模块,充分学习帧与帧间的“邻接性”与“距离性”空间依赖关系;另外,利用残差反转瓶颈进行重采样,以保持跨尺度的语义丰富性。在DDFF 12-Scene真实场景数据集上的实验结果显示,相较于DfFintheWild模型,3D SCHAM在深度值准确度度量的3个阈值 1.25,1 . 25 2 , 1 . 25 3 上的精确度分别提升了15.34%、3.62%、0.86%,验证了该模型在真实场景的鲁棒性。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 融合视觉特征增强机制的机器人弱光环境抓取检测
李淦, 牛洺第, 陈路, 杨静, 闫涛, 陈斌
《计算机应用》唯一官方网站    2023, 43 (8): 2564-2571.   DOI: 10.11772/j.issn.1001-9081.2023050586
摘要382)   HTML37)    PDF (2821KB)(967)    收藏

现有的机器人抓取操作通常在良好光照条件下开展,此时目标细节清晰、区域对比度高,而在夜间、遮挡等弱光环境下目标的视觉特征微弱,会导致现有的机器人抓取检测模型的检测准确率急剧下降。为提高弱光场景下稀疏、微弱抓取特征的表征能力,提出一种融合视觉特征增强机制的抓取检测模型,通过视觉增强子任务为抓取检测施加特征增强约束。对于抓取检测模块,采用仿U-Net框架的编码器-解码器结构实现特征的高效融合;对于弱光增强模块,从局部、全局层面分别提取纹理、颜色信息,以实现兼顾目标细节与视觉效果的特征增强。此外,分别构建弱光Cornell数据集和弱光Jacquard数据集两个新的弱光抓取基准数据集,并基于上述数据集开展对比实验。实验结果表明,所提弱光抓取检测模型在基准数据集上的准确率分别达到了95.5%和87.4%,与生成抓取卷积神经网络(GG-CNN)、生成残差卷积神经网络(GR-ConvNet)等现有抓取检测模型相比,准确率在弱光Cornell数据集提升11.1、1.2个百分点,在弱光Jacquard数据集上提升5.5、5.0个百分点,取得了较好的抓取检测效果。

图表 | 参考文献 | 相关文章 | 多维度评价
5. 全局时空特征耦合的多景深三维形貌重建
张江峰, 闫涛, 陈斌, 钱宇华, 宋艳涛
《计算机应用》唯一官方网站    2023, 43 (3): 894-902.   DOI: 10.11772/j.issn.1001-9081.2022101589
摘要205)   HTML5)    PDF (2603KB)(62)    收藏

针对现有三维形貌重建模型无法有效融合全局时空信息的问题,设计深度聚焦体积(DFV)模块保留聚焦和离焦的过渡信息,并在此基础上提出全局时空特征耦合(GSTFC)模型提取多景深图像序列的局部与全局的时空特征信息。首先,在收缩路径中穿插3D-ConvNeXt模块和3D卷积层,捕捉多尺度局部时空特征,同时,在瓶颈模块中添加3D-SwinTransformer模块捕捉多景深图像序列局部时序特征的全局关联关系;然后,通过自适应参数层将局部时空特征和全局关联关系融合为全局时空特征,并输入扩张路径引导生成聚焦体积;最后,聚焦体积通过DFV提取序列权重信息,并保留聚焦与离焦的过渡信息,得到最终深度图。实验结果表明,GSTFC在FoD500数据集上的均方根误差(RMSE)相较于最先进的全聚焦深度网络(AiFDepthNet)下降了12.5%,并且比传统的鲁棒聚焦体积正则化的聚焦形貌恢复(RFVR-SFF)模型保留了更多的景深过渡关系。

图表 | 参考文献 | 相关文章 | 多维度评价
6. 基于级联混沌系统的分数域语音加密算法
徐丽云, 闫涛, 钱宇华
计算机应用    2021, 41 (9): 2623-2630.   DOI: 10.11772/j.issn.1001-9081.2020122044
摘要411)      PDF (2308KB)(382)    收藏
为保证语音信号在通信传输中的安全性,提出一种基于级联混沌系统的分数域语音加密算法。首先,对语音信号进行分组;其次,利用混沌系统获取分数傅里叶变换的阶次,各组数据对应的阶次呈动态变化;然后,采用具有较低计算复杂度的采样型分数傅里叶离散变换得到各组对应的分数域谱数据;最后,利用级联混沌系统依次对各组分数域进行数据加密,从而实现语音信号的整体加密。实验结果表明,所提算法对密钥具有极大的敏感度,得到的加密信号与原信号相比波形和分数域谱分布更均匀、相关性更小;同时与频域加密和固定阶次的分数域加密方法相比,该算法能有效增大密钥空间,同时降低计算复杂度。可见所提算法能够有效满足语音信号的实时安全传输要求。
参考文献 | 相关文章 | 多维度评价
7. 基于爆炸冲击波模型的粒子群优化算法
闫涛 古乐野 阮波
计算机应用    2014, 34 (7): 2085-2089.   DOI: 10.11772/j.issn.1001-9081.2014.07.2085
摘要190)      PDF (632KB)(462)    收藏

针对基本粒子群优化(PSO)算法在解决复杂多峰问题时易于陷入局部最优解的问题,提出一种基于爆炸冲击波模型的PSO算法(简称BW-PSO算法)。该算法通过加入种群多样性监督条件,使得当种群数量缩小至给定阈值时,触发粒子冲击波过程:最优粒子与次优粒子进行交叉变异,处于爆炸半径内的粒子受到牵引力,加速收敛至当前极值;处于爆炸半径外的粒子受到冲击力向外扩散,增加了找到全局最优值的可能性。BW-PSO算法不仅能够通过最优粒子变异操作提升当前解的精度,而且通过粒子冲击波过程,增加了种群多样性,提升了粒子对全局空间开发的能力。实验结果表明,基于爆炸冲击波模型的PSO算法在求解多峰问题表现优于变异PSO算法与带电PSO算法。

参考文献 | 相关文章 | 多维度评价
8. 全局时空特征耦合的多景深三维形貌重建
张江峰 闫涛 陈斌 钱宇华 宋艳涛
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2022101589
录用日期: 2023-01-16

9. 改进的CloFormer模型与有序回归相结合的年龄评估方法
付帅 郭小英 白茹意 闫涛 陈斌
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2023081199
预出版日期: 2024-08-23

10. 融合空间-傅里叶域信息的机器人低光环境抓取检测
陈路 王怀瑶 刘京阳 闫涛 陈斌
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2024111686
预出版日期: 2025-02-26