期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于EfficientNetV2和物体上下文表示的胃癌图像分割方法
周迪, 张自力, 陈佳, 胡新荣, 何儒汉, 张俊
《计算机应用》唯一官方网站    2023, 43 (9): 2955-2962.   DOI: 10.11772/j.issn.1001-9081.2022081159
摘要481)   HTML27)    PDF (4902KB)(232)    收藏

针对U-Net上采样过程容易丢失细节信息,以及胃癌病理图像数据集普遍偏小,容易出现过拟合的问题,提出一种基于改进U-Net的自动分割胃癌病理图像模型EOU-Net。EOU-Net在U-Net模型的基础上,将EfficientNetV2作为骨干特征提取网络,以增强网络编码器的特征提取能力。在解码阶段,基于物体上下文表示(OCR)探究细胞像素间的关系,并使用改进后的OCR模块解决上采样图像的细节丢失问题;然后,使用验证阶段增强(TTA)后处理对输入图像进行翻转和不同角度旋转后分别预测这些图像,再通过特征融合的方式将多个输入图像预测结果进行合并,进一步优化网络的输出结果,从而有效解决医学数据集较小的问题。在SEED、BOT以及PASCAL VOC 2012数据集上的实验结果表明,与OCRNet相比,EOU-Net的平均交并比(MIoU)分别提高了1.8、0.6以及4.5个百分点。可见EOU-Net能得到更准确的胃癌图像分割结果

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于多头软注意力图卷积网络的行人轨迹预测
彭涛, 康亚龙, 余锋, 张自力, 刘军平, 胡新荣, 何儒汉, 李丽
《计算机应用》唯一官方网站    2023, 43 (3): 736-743.   DOI: 10.11772/j.issn.1001-9081.2022020207
摘要459)   HTML21)    PDF (5673KB)(213)    PDF(mobile) (2752KB)(32)    收藏

行人间交互作用的复杂性给行人轨迹预测带来了挑战,且现有算法难以捕获行人间有意义的交互信息,不能直观地建模行人间的交互作用。针对以上问题,提出多头软注意力图卷积网络。首先利用多头软注意力(MS ATT)结合内卷网络Involution分别从空间图和时间图输入中提取稀疏空间和稀疏时间邻接矩阵,生成稀疏空间和稀疏时间有向图;然后,利用图卷积网络(GCN)从稀疏空间和稀疏时间有向图中学习交互作用与运动趋势特征;最后,将学习到的轨迹特征输入时间卷积网络(TCN)以预测双高斯分布参数,生成行人预测轨迹。在ETH和UCY数据集上的实验结果表明:相较于空时社交关系池化行人轨迹预测模型(SOPM),所提算法的平均位移误差(ADE)降低了2.78%;相较于稀疏图卷积网络(SGCN),所提算法的最终位移误差(FDE)降低了16.92%。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 级联跨域特征融合的虚拟试衣
胡新荣, 张君宇, 彭涛, 刘军平, 何儒汉, 何凯
《计算机应用》唯一官方网站    2022, 42 (4): 1269-1274.   DOI: 10.11772/j.issn.1001-9081.2021071274
摘要290)   HTML5)    PDF (1058KB)(92)    收藏

基于图像合成蒙版策略的虚拟试衣技术在扭曲服装和人体融合时能较好地保留服装细节。然而由于在试衣过程中人体和服装的位置和结构难以对齐,试衣结果容易产生严重的遮挡,影响视觉效果。为解决试衣过程中的遮挡问题,提出了一种基于U-Net的生成器。该生成器在U-Net解码器上添加级联的空间和通道注意力模块,从而实现了着装人体的局部特征和扭曲服装的和全局特征的跨域融合。形式上,首先采用卷积网络预测薄板样条插值(TPS)变换的方法将服装根据目标人体姿态进行扭曲;然后,将着装人体解析信息和扭曲服装输入到提出的生成器中,并获取对应服装区域的掩码图像以渲染中间结果;最后,采用掩码合成的策略来通过掩码处理将扭曲服装与中间结果合成得到最终的试衣结果。实验结果表明,所提方法不仅可以减少遮挡,而且增强了图像细节,相较于CP-VTON方法,产生的图像的平均峰值信噪比(PSNR)提高了10.47%,平均FID减小了47.28%,平均结构相似性(SSIM)提高了4.16%。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 基于改进Inception结构的知识图谱嵌入模型
余晓鹏, 何儒汉, 黄晋, 张俊杰, 胡新荣
《计算机应用》唯一官方网站    2022, 42 (4): 1065-1071.   DOI: 10.11772/j.issn.1001-9081.2021071265
摘要575)   HTML30)    PDF (570KB)(207)    收藏

知识图谱嵌入(KGE)将实体和关系映射到低维连续向量空间中,以利用机器学习方法实现关系数据的应用,如知识分析、推理、补全等。以ConvE为代表将卷积神经网络(CNN)应用于知识图谱嵌入中,以捕捉实体和关系的交互信息,但其标准卷积捕捉特征交互信息能力不足,特征表达能力低下。针对特征交互能力不足问题,提出了一种改进的Inception结构,在此基础上构建一个知识图谱嵌入模型InceE。首先,该结构使用混合空洞卷积替代标准卷积,以提高特征交互信息捕捉能力;其次,使用残差网络结构,以减少特征信息丢失。实验使用基准数据集Kinship、FB15k、WN18验证InceE链接预测有效性。在Kinship、FB15k数据集上,相较于ArcE和QuatRE模型,InceE的Hit@1分别提升了1.6和1.5个百分点;在三个数据集上,与ConvE对比,InceE的Hit@1分别提升了6.3、20.8和1.0个百分点。实验结果表明InceE具有更强的特征交互信息捕捉能力。

图表 | 参考文献 | 相关文章 | 多维度评价