多媒体计算与计算机仿真

Select

1. 基于检测与跟踪相互迭代的极暗弱目标搜索算法

効琦, 尹增山, 高爽

计算机应用 2021, 41 (10): 3017-3024. DOI: 10.11772/j.issn.1001-9081.2020122000

摘要（352）

PDF （1788KB）（379）

针对极低信噪比（LSNR）情况下暗弱运动目标和背景噪声的强度难以区分的问题，提出了一种基于检测与跟踪相互迭代的极暗弱目标搜索算法，总体上采用将时域检测与空域跟踪的过程联合、迭代进行的新型策略。首先，在检测过程中计算检测窗口内信号片段与已经提取的背景估计特征的差别；然后，在跟踪过程中运用动态规划算法保留使得轨迹能量累积最大的轨迹；最后，自适应地调整下一检测过程中被保留轨迹的检测器阈值参数，使该轨迹内的像素能以更宽容的策略被保留到下一检测跟踪阶段。实验测试结果表明，所提算法可以在1%~2%的虚警率和约70%的检测率下探测到低至0 dB的暗弱运动目标。可见该算法可有效改善对LSNR暗弱目标的检测能力。

参考文献 | 相关文章 | 多维度评价

Select

2. 融合空间和通道特征的高精度乳腺癌分类方法

许学斌, 张佳达, 刘伟, 路龙宾, 赵雨晴

计算机应用 2021, 41 (10): 3025-3032. DOI: 10.11772/j.issn.1001-9081.2020111891

摘要（394）

PDF （1343KB）（295）

组织病理学图像是鉴别乳腺癌的黄金标准，所以对乳腺癌组织病理学图像的自动、精确的分类具有重要的临床应用价值。为了提高乳腺组织病理图像的分类准确率，从而满足临床应用的需求，提出了一种融合空间和通道特征的高精度乳腺癌分类方法。该方法使用颜色归一化来处理病理图像并使用数据增强扩充数据集，基于卷积神经网络（CNN）模型DenseNet和压缩和激励网络（SENet）融合病理图像的空间特征信息和通道特征信息，并根据压缩-激励（SE）模块的插入位置和数量，设计了三种不同的BCSCNet模型，分别为BCSCNetⅠ、BCSCNetⅡ、BCSCNetⅢ。在乳腺癌癌组织病理图像数据集（BreaKHis）上展开实验。通过实验对比，先是验证了对图像进行颜色归一化和数据增强能提高乳腺的分类准确率，然后发现所设计的三种乳腺癌分类模型中精度最高为BCSCNetⅢ。实验结果表明，BCSCNetⅢ的二分类准确率在99.05%~99.89%，比乳腺癌组织病理学图像分类网络（BHCNet）提升了0.42个百分点；其多分类的准确率在93.06%~95.72%，比BHCNet提升了2.41个百分点。证明了BCSCNet能准确地对乳腺癌组织病理图像进行分类，同时也为计算机辅助乳腺癌诊断提供了可靠的理论支撑。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于改进型变分自编码器的不确定性空间信息重建方法

屠红艳, 张挺, 夏鹏飞, 杜奕

计算机应用 2021, 41 (10): 2959-2963. DOI: 10.11772/j.issn.1001-9081.2020081338

摘要（297）

PDF （1274KB）（234）

不确定性空间信息在众多科学领域得到了广泛应用。然而目前用于不确定性空间信息重建的方法需要多次对训练图像（TI）进行扫描，再通过复杂的概率计算获得模拟结果，导致这些方法的效率较低，且模拟过程复杂。针对这一问题，提出了将费雪信息量和变分自编码器（VAE）结合应用于不确定性空间信息的重建。首先，通过编码器神经网络对空间信息的结构特征进行学习，并训练得到空间信息的均值和方差；然后，进行随机采样，根据采样结果和空间信息的均值、方差重建中间结果，并将编码器神经网络的优化函数与费雪信息量相结合来优化网络；最后，将中间结果输入解码器神经网络中，以对空间信息进行解码重建，并将解码器的优化函数与费雪信息量结合对重建结果进行优化。通过比较各方法重建结果与训练数据的多点连通曲线、变差函数、孔隙分布和孔隙度表明，所提方法的重建质量比其他方法的更好。具体来说，该方法重建结果的平均孔隙度为0.171 5，与其他方法重建结果的平均孔隙度更接近训练数据的孔隙度0.170 5。且相较于传统方法，其平均CPU利用率从90%下降到25%，平均内存占用下降了50%，说明该方法的重建效率更高。而通过重建质量和重建效率两个方面的对比，说明了该方法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于定位不确定性的鲁棒3D目标检测方法

裴仪瑶, 郭会明, 张丹普, 陈文博

计算机应用 2021, 41 (10): 2979-2984. DOI: 10.11772/j.issn.1001-9081.2020122055

摘要（406）

PDF （1259KB）（267）

针对3D点云训练数据因人工标注不精确而导致模型定位不准确的问题，提出了一种基于定位不确定性的鲁棒3D目标检测方法。首先，以基于3D体素网格的稀疏嵌入卷积检测（SECOND）网络作为基础网络，在候选区域生成网络（RPN）的基础上增加对定位不确定性的预测；然后，在训练过程中使用高斯和拉普拉斯两种分布模型对定位不确定性进行建模，并对定位损失函数进行重新定义；最后，在预测过程中结合定位不确定性和分类置信度作为目标置信度，使用阈值过滤和非极大值抑制（NMS）方法筛选候选目标。实验结果表明，在KITTI 3D目标检测数据集上，所提算法对于车辆类别的检测准确率在中等难度上比SECOND网络提高了0.5个百分点；当在训练数据中额外加入扰动模拟噪声的情况下，所提算法的检测准确率比SECOND网络最多提高了3.1个百分点。所提算法提高了3D目标检测准确率，减少了误检且提高了3D边界框的精度，并且对于带噪声的数据更鲁棒。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于场景图划分的无人机影像定位算法

张驰, 李铸洪, 刘舟, 沈未名

计算机应用 2021, 41 (10): 3004-3009. DOI: 10.11772/j.issn.1001-9081.2020111795

摘要（318）

PDF （1581KB）（308）

针对大规模长序列无人机（UAV）影像定位中存在的速度慢、误差漂移等问题，结合UAV影像的特点，提出了一种基于场景图划分的UAV影像定位算法。首先，利用全球定位系统（GPS）辅助信息缩小特征匹配的空间搜索范围，从而加速同名点的提取；之后结合视觉一致性和空间一致性来构建场景图，并利用归一化割（Ncut）对其进行划分；接着，对各组场景图进行增量重建；最后，利用光束法平差（BA）融合场景图从而计算出场景的三维模型。此外，在BA阶段，所提算法对代价函数进行扩充，即加入了GPS空间约束信息。在四个UAV影像数据集上的实验结果表明，与COLMAP等多种运动恢复结构（SFM）算法相比，所提算法的定位速度提升了50%，重投影误差减小了41%，定位误差控制在0.5m之内。此外，通过有无GPS辅助下的算法的实验对比，可以得知引入相对和绝对GPS约束的BA有效解决了误差漂移问题，避免了出现歧义性结果，并且极大地减小了定位误差。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于外观和动作特征双预测模型的视频异常行为检测

李自强, 王正勇, 陈洪刚, 李林怡, 何小海

计算机应用 2021, 41 (10): 2997-3003. DOI: 10.11772/j.issn.1001-9081.2020121906

摘要（434）

PDF （1399KB）（452）

为了在视频异常行为检测中更加充分地运用外观和动作信息，设计出了一种能同时捕捉外观和动作信息的孪生网络模型。该网络的两个分支采用相同的自编码器结构，其中的外观子网络以连续几帧RGB图作为输入来预测下一帧，而动作子网络则输入RGB帧差图来预测未来帧差图。此外，考虑到影响基于预测的方法的检测效果的原因之一，即正常样本的多样性以及自编码器网络强大的“生成”能力，即对部分异常样本也有很好的预测效果，因此在编码器与解码器之间加入一个学习并存储正常样本的“原型”特征的记忆增强模块，从而使异常样本能获得更大的预测误差。在Avenue、UCSD-ped2和ShanghaiTech三个公共的异常数据集上进行了广泛的实验。实验结果表明，相较于其他基于重建或预测的视频异常行为检测方法，所提方法取得了更优异的表现。具体来说，该方法在Avenue、UCSD-ped2和ShanghaiTech数据集上的平均曲线下面积（AUC）分别达到了88.2%、97.5%和73.0%。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于可分离金字塔的轻量级实时语义分割算法

高世伟, 张长柱, 王祝萍

计算机应用 2021, 41 (10): 2937-2944. DOI: 10.11772/j.issn.1001-9081.2020121939

摘要（394）

PDF （2525KB）（248）

针对现有语义分割算法参数量过多、内存占用巨大导致其很难满足自动驾驶需要等现实应用的问题，提出一种基于可分离金字塔模块（SPM）的新颖、有效且轻量的实时语义分割算法。首先，利用特征金字塔形式的分解卷积和扩张卷积来构建瓶颈结构，从而以一种简单但有效的方式提取局部和上下文信息；然后，提出基于计算机视觉注意力的上下文通道注意力（CCA）模块，来利用深层语义修改浅层特征图通道权重优化分割效果。实验结果显示：所提出的算法在Cityscapes测试集上以每秒91帧的速度达到了71.86%的平均交并比（mIoU）。相较高效残差分解卷积网络（ERFNet），所提算法mIoU提高了3.86个百分点，处理速度是其2.2倍；与最新的非局部高效实时算法（LRNNet）相比，所提算法mIoU略低0.34个百分点，但处理速度每秒上升了20帧。实验结果表明，所提算法有助于完成如自动驾驶中要求的高效、准确的街道场景图像分割任务。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于自动编码器的深度伪造图像检测方法

张亚, 金鑫, 江倩, 李昕洁, 董云云, 姚绍文

计算机应用 2021, 41 (10): 2985-2990. DOI: 10.11772/j.issn.1001-9081.2020122046

摘要（568）

PDF （769KB）（411）

基于深度学习的图像伪造方法生成的图像肉眼难辨，一旦该技术被滥用于制作虚假图像和视频，可能会对国家政治、经济、文化造成严重的负面影响，也可能会对社会生活和个人隐私构成威胁。针对上述问题，提出了一种基于自动编码器的深度伪造Deepfake图像检测方法。首先，借助高斯滤波对图像进行预处理，提取高频信息作为模型输入；然后，利用自动编码器对图像进行特征提取，并在编码器中添加注意力机制模块以获取更好的分类效果；最后，通过消融实验证明，采用所提的预处理方法和添加注意力机制模块有助于伪造图像检测。实验结果表明，与ResNet50、Xception以及InceptionV3相比，所提方法在数据集样本量较小且包含的场景丰富时，可以有效检测多种生成方法所伪造的图像，其平均准确率可达97.10%，明显优于对比方法，且其泛化性能也明显优于对比方法。

参考文献 | 相关文章 | 多维度评价

Select

9. 基于多残差UNet的CT图像高精度稀疏重建

张艳娇, 乔志伟

计算机应用 2021, 41 (10): 2964-2969. DOI: 10.11772/j.issn.1001-9081.2020121985

摘要（459）

PDF （1075KB）（550）

为了解决计算机断层成像（CT）稀疏解析重建过程中产生条状伪影的问题，在经典的UNet网络结构的基础上，提出了多残差UNet （Mr-UNet）网络结构，以更好地压制条状伪影。首先，用传统滤波反投影（FBP）解析重建算法稀疏重建出含条状伪影的稀疏图像；然后，将该类图像作为网络结构的输入，且将相对应的高精度图像作为网络的标签进行训练，使得该网络具有很好的压制条状伪影的性能；最后，将经典UNet原先的四层下采样加深到五层，并在模型中引入残差学习机制将每个卷积单元构建为残差结构，从而提升网络的训练性能。实验中采用了2 000对大小为256×256的含条状伪影图像和对应的高精度图像作为数据集，其中，1 900对作为训练集，50对作为验证集，其余的作为测试集来训练网络，并验证、评估网络性能。实验结果表明，与传统的总变差（TV）最小化算法及经典的UNet深度学习方法的比较表明，所提模型重建图像的均方根误差（RMSE）平均降低了约0.002 5，结构相似度（SSIM）平均提高了约0.003，且能更好地保留图像纹理和细节信息。

参考文献 | 相关文章 | 多维度评价

Select

10. 基于编码解码结构的移动端电力线语义分割方法

黄巨挺, 高宏力, 戴志坤

计算机应用 2021, 41 (10): 2952-2958. DOI: 10.11772/j.issn.1001-9081.2020122037

摘要（315）

PDF （1631KB）（298）

针对传统的视觉算法在复杂场景下检测细长电力线准确率低、受环境因素干扰大，现有基于深度学习的电线检测算法效率不高的问题，提出一种适用于移动端电力线检测的端到端全卷积神经网络模型。首先，采用一种对称的编码-解码结构，其中编码部分使用最大池化层进行下采样，以提取多尺度特征，而解码部分使用最大池化索引的非线性上采样方式逐层融合多尺度特征，以恢复图像细节；其次，针对电线像素与背景像素不平衡的问题，采用了一种加权损失函数来训练模型；最后，构建了一个背景复杂且有像素级标注的电线数据集来训练和评估模型，并重新标注了一个公开电线数据集作为不同源测试集。与现有移动端电线语义分割模型Dilated ConvNet相比，所提模型在移动端设备GPU NVIDIA JetsonTX2上对于512×512分辨率的图片的预测速度提升至Dilated ConvNet的两倍，达到8.2 frame/s所提模型在同源测试集上的平均交并比（mIoU）为0.857 3，F1分数为0.844 7，平均精度（AP）为0.927 9，这三个指标分别提升了0.011、0.014和0.008；所提模型在公开测试集上的mIoU达到0.724 4，F1分数达到0.634 1，AP达到0.664 4，这三个指标分别提升了0.004、0.007和0.032。实验结果表明，该模型具有更好的移动端电力线实时分割性能。

参考文献 | 相关文章 | 多维度评价

Select

11. 基于多尺度特征融合的行人重识别方法

韩建栋, 李晓宇

计算机应用 2021, 41 (10): 2991-2996. DOI: 10.11772/j.issn.1001-9081.2020121908

摘要（419）

PDF （1794KB）（372）

针对行人重识别任务在特征提取时缺乏对行人特征尺度变化的考虑，导致其易受环境影响而具有低行人重识别准确率的问题，提出了一种基于多尺度特征融合的行人重识别方法。首先，在网络浅层通过混合池化操作来提取多尺度的行人特征，从而帮助网络提升特征提取能力；然后，在残差块内添加条形池化操作以分别提取水平和竖直方向的远程上下文信息，从而避免无关区域的干扰；最后，在残差网络之后利用不同尺度的空洞卷积进一步保留多尺度的特征，从而帮助模型灵活有效地解析场景结构。实验结果表明，在Market-1501数据集上，所提方法的Rank1达到95.9%，平均精度均值（mAP）为88.5%；在DukeMTMC-reID数据集上，该方法的Rank1达到90.1%，mAP为80.3%。可见所提方法能够较好地保留行人特征信息，从而提高行人重识别任务准确率。

参考文献 | 相关文章 | 多维度评价

Select

12. 基于改进迭代最近点算法的接骨板贴合性快捷计算方法

朱新成, 何坤金, 倪娜, 郝博

计算机应用 2021, 41 (10): 3033-3039. DOI: 10.11772/j.issn.1001-9081.2020122012

摘要（277）

PDF （2201KB）（199）

为了快速计算出接骨板在断骨表面的最佳贴合位置，以减少手术中接骨板反复调整的次数，提出了一种基于改进迭代最近点（ICP）算法的接骨板贴合性快捷计算方法。首先，由医生指导在断骨表面选取贴合区域，并利用接骨板表面点的法向量之间的夹角提取接骨板的内曲面点云；然后，在对两组点云模型进行平滑处理并采用格点采样的方式来简化点云模型后，利用点云之间的特征关系进行初始配准；最后，对接骨板内曲面点云模型进行边界及内部特征关键点提取，并采用 K-维树（KD-Tree）搜索邻近点，对接骨板的特征关键点和断骨表面选取区域执行ICP精确配准。以胫骨为例进行实验，实验结果表明，所提算法相较于近年所提配准算法在保持较高配准度的同时提高了配准效率，能够实现胫骨不同受损类型与接骨板之间的快速配准，并且对其他受损骨骼具有通用性。

参考文献 | 相关文章 | 多维度评价

Select

13. 基于注意力机制网络的航运监控图像识别模型

张凯悦, 张鸿

计算机应用 2021, 41 (10): 3010-3016. DOI: 10.11772/j.issn.1001-9081.2020121899

摘要（273）

PDF （1343KB）（320）

针对已有的航运监控图像识别模型C3D里中级表征学习能力有限，有效特征的提取容易受到噪声的干扰，且特征的提取忽视了整体特征与局部特征之间关系的问题，提出了一种新的基于注意力机制网络的航运监控图像识别模型。该模型基于卷积神经网络（CNN）框架，首先，通过特征提取器提取图像的浅层次特征；然后，基于CNN对不同区域激活特征的不同响应强度，生成注意力信息并实现对局部判别性特征的提取；最后，使用多分支的CNN结构融合局部判别性特征和图像全局纹理特征，从而利用局部判别性特征和图像全局纹理特征的交互关系提升CNN学习中级表征的能力。实验结果表明，所提出的模型在航运图像数据集上的识别准确率达到91.8%，相较于目前的C3D模型提高了7.2个百分点，相较于判别滤波器组卷积神经网络（DFL-CNN）模型提高了0.6个百分点。可见所提模型能够准确判断船舶的状态，可以有效应用于航运监控项目。

参考文献 | 相关文章 | 多维度评价

Select

14. 基于蚁群优化算法的弱光图像显著性目标检测

汪虹余, 张彧, 杨恒, 穆楠

计算机应用 2021, 41 (10): 2970-2978. DOI: 10.11772/j.issn.1001-9081.2020111814

摘要（361）

PDF （1306KB）（348）

近年来，显著性目标检测受到工业界和学术界的大量关注，成为了计算机视觉领域中一项重要的基础研究，该问题的解决有助于各类视觉任务取得突破性进展。尽管针对可见光场景的显著性检测工作已经取得了有效成果，但如何在信噪比偏低、可用有效信息匮乏的弱光图像中提取边界清晰、内部结构准确的显著性目标，仍然是具有挑战性的难题。针对弱光场景下显著性目标检测存在边界模糊、结构不完整等造成准确率较低的问题，提出基于蚁群优化（ACO）算法的显著性检测模型。首先，通过多尺度超像素分割将输入图像转换为具有不同节点的无向图；其次，基于最优特征选择策略来更充分地获取低对比度弱光图像中所包含的更多显著目标的特征信息，并摒弃冗余的噪声信息；然后，引入空间对比度策略用于探索弱光图像中具有相对较高对比度的全局显著性线索。而为了在低信噪比情况下也能获取准确的显著性估计，利用ACO算法对显著图进行优化。通过在3个公共数据集（MSRA、CSSD和PASCAL-S）以及夜间弱光图像（NI）数据集上进行实验，可以看出，所提模型在3个公共数据集上的曲线下面积（AUC）值分别达到了87.47%、84.27%和81.58%，在NI数据集上的AUC值比排名第2的低秩矩阵恢复（LR）模型提高了2.17个百分点。实验结果表明，相较于11种主流的显著性检测模型，所提模型具有结构更准确且边界更清晰的检测效果，有效抑制了弱光场景对显著性目标检测性能的干扰。

参考文献 | 相关文章 | 多维度评价

Select

15. 动态环境下基于深度学习的语义SLAM算法

郑思诚, 孔令华, 游通飞, 易定容

计算机应用 2021, 41 (10): 2945-2951. DOI: 10.11772/j.issn.1001-9081.2020111885

摘要（502）

PDF （1572KB）（1120）

针对应用场景中存在的运动物体会降低视觉同步定位与地图构建（SLAM）系统的定位精度和鲁棒性的问题，提出一种基于语义信息的动态环境下的视觉SLAM算法。首先，将传统视觉SLAM前端与YOLOv4目标检测算法相结合，在对输入图像进行ORB特征提取的同时，对该图像进行语义分割；然后，判断目标类型以获得动态目标在图像中的区域，剔除分布在动态物体上的特征点；最后，使用处理后的特征点与相邻帧进行帧间匹配来求解相机位姿。实验采用TUM数据集进行测试，测试结果表明，所提算法相较于ORB-SLAM2在高动态环境下在位姿估计精度上提升了96.78%，同时该算法的跟踪线程处理一帧的平均耗时为0.065 5 s，相较于其他应用在动态环境下的SLAM算法耗时最短。实验结果表明，所提算法能够实现在动态环境中的实时精确定位与建图。

参考文献 | 相关文章 | 多维度评价

Select

16. 基于非对称卷积-压缩激发-次代残差网络的人脸关键点检测

王贺兵, 张春梅

计算机应用 2021, 41 (9): 2741-2747. DOI: 10.11772/j.issn.1001-9081.2020111847

摘要（394）

PDF （2305KB）（294）

级联深度卷积神经网络（DCNN）算法为首先在人脸关键点检测中使用卷积神经网络（CNN）的模型，CNN的使用使得检测精度得到极大的提升。针对该策略需要对相邻阶段间的数据反复进行回归处理使得算法流程十分复杂的问题，提出基于非对称卷积-压缩激发-次代残差网络（AC-SE-ResNeXt）的人脸关键点检测算法。所提算法仅使用单阶段回归，既避免了级联策略中多阶段回归的算法流程复杂性，又解决了相邻阶段间数据需要进行预处理的问题。为了不降低精度，在次代残差网络（ResNeXt）块的基础上添加了非对称卷积（AC）模块和压缩激发（SE）模块，构建了AC-SE-ResNeXt网络模型。同时，为了能够精确拟合在不同光照、姿态、表情等复杂环境下的人脸，将AC-SE-ResNeXt网络模型加深到101层。对训练好的模型分别在数据集BioID和LFPW上进行测试，其中该模型在BioID数据集上的人脸五点关键点检测的综合平均误差率为1.99%，在LFPW数据集上的人脸五点关键点检测的综合平均误差率为2.3%。实验结果表明，所改进的算法不但简化了算法流程使之能进行端到端处理，而且其精度与级联DCNN算法相当，鲁棒性也有明显提升。

参考文献 | 相关文章 | 多维度评价

Select

17. 基于改进的Faster R-CNN的通用目标检测框架

马佳良, 陈斌, 孙晓飞

计算机应用 2021, 41 (9): 2712-2719. DOI: 10.11772/j.issn.1001-9081.2020111852

摘要（586）

PDF （2181KB）（483）

针对当前基于深度学习的检测器不能有效检测形状不规则或长宽相差悬殊的目标的问题，在传统Faster R-CNN算法的基础上，提出了一个改进的二阶段目标检测框架——Accurate R-CNN。首先，提出了新的交并比（IoU）度量——有效交并比（EIoU），通过提出中心度权重来降低训练数据中冗余包围框的占比。然后，提出了一个上下文相关的特征重分配模块（FRM），通过建模目标的远程依赖和局部上下文关系信息对特征进行重编码，以弥补池化过程中的形状信息损失。实验结果表明，在微软多场景通用目标（MS COCO）数据集上，对于包围框检测任务，当使用深度为50和101的残差网络（ResNet）作为骨干网络时，Accurate R-CNN比基线模型Faster R-CNN的平均精度（AP）分别提高了1.7个百分点和1.1个百分点，超越了使用同样骨干网络的基于掩膜的检测器。在添加掩膜分支后，对于实例分割任务，当使用两种不同深度的ResNet作为骨干网络时，Accurate R-CNN比Mask R-CNN的掩膜平均精度分别提高了1.2个百分点和1.1个百分点。研究结果显示，相较于基线模型，Accurate R-CNN在不同数据集、不同任务上均取得了更好的检测效果。

参考文献 | 相关文章 | 多维度评价

Select

18. 基于深度学习的三维点云人脸识别

高工, 杨红雨, 刘洪

计算机应用 2021, 41 (9): 2736-2740. DOI: 10.11772/j.issn.1001-9081.2020111826

摘要（607）

PDF （1375KB）（576）

为了增强三维点云人脸识别系统针对多表情、多姿态的鲁棒性，提出一种基于深度学习的点云特征提取网络ResPoint。ResPoint网络使用了分组、采样和局部特征提取（ResConv）等模块，而在ResConv模块中使用了跳跃式连接，因此所提网络对于稀疏点云有很好的识别结果。首先通过人脸几何特征点定位鼻尖点，并以该点为中心切割出面部区域，切割出的区域有噪点并且有孔洞，因此对其进行高斯滤波和三维立方插值；其次，使用ResPoint网络对预处理后的点云数据提取特征；最后，在全连接层组合特征以实现三维人脸的分类。在CASIA三维人脸数据库上的实验中，与关系型卷积神经网络（RS-CNN）相比，ResPoint网络的识别正确率提高了5.06%。实验结果表明，ResPoint网络增加了网络深度的同时使用不同的卷积核提取特征，因此ResPoint网络有更好的特征提取能力。

参考文献 | 相关文章 | 多维度评价

Select

19. 结合目标检测的室内场景识别方法

徐江浪, 李林燕, 万新军, 胡伏原

计算机应用 2021, 41 (9): 2720-2725. DOI: 10.11772/j.issn.1001-9081.2020111815

摘要（504）

PDF （1357KB）（382）

在目标检测网络（ObjectNet）和场景识别网络相结合的方法中，由于ObjectNet提取的目标特征和场景网络提取的场景特征的维度和性质不一致，且目标特征中存在影响场景判断的冗余信息，导致场景识别的准确率低。针对这个问题，提出一种改进的结合目标检测的室内场景识别方法。首先，在ObjectNet中引入类转换矩阵（CCM），将ObjectNet输出的目标特征进行转化，使得目标特征的维度与场景特征的维度相一致，以此减少特征维度不一致带来的信息丢失；然后采用上下文门控（CG）机制对特征中的冗余信息进行抑制，从而降低不相关信息的权重，提高了目标特征在场景识别中的作用。该方法在MIT Indoor67数据集上的识别准确率达到90.28%，与维护空间布局的对象语义特征（SOSF）方法相比识别准确率提高了0.77个百分点；其在SUN397数据集上识别准确率达到81.15%，与交替专家层次结构（HoAS）方法相比识别准确率提高了1.49个百分点。实验结果表明，所提方法提高了室内场景识别的准确率。

参考文献 | 相关文章 | 多维度评价

Select

20. 带旋转与尺度估计的全卷积孪生网络目标跟踪算法

姬张建, 任兴旺

计算机应用 2021, 41 (9): 2705-2711. DOI: 10.11772/j.issn.1001-9081.2020111805

摘要（368）

PDF （2425KB）（262）

针对目标跟踪任务中，全卷积孪生网络（SiamFC）跟踪算法存在因目标的旋转、尺度变化而造成跟踪错误或跟踪结果不准确的问题，提出一种带旋转与尺度估计的SiamFC跟踪算法。该算法由定位模块与旋转、尺度估计模块两部分组成。首先在定位模块中，利用SiamFC算法获得跟踪位置，并结合旋转与尺度信息对该位置进行调整；其次在旋转、尺度估计模块中，鉴于图像的旋转和尺度变化在对数极坐标系下变成了平移运动，将目标搜索区域从笛卡儿坐标系变换到对数极坐标系下，由此便可利用相关滤波技术估计待跟踪目标的尺度和旋转角度；最终实现了一个能同步估计目标位置、旋转角度以及尺度变化的目标跟踪模型。在对比实验中，该算法在OTB2015数据集上的成功率与准确率分别达到57.7%和81.4%；在包含目标旋转和尺度变化的POT数据集上的成功率与准确率分别达到51.8%和53.3%。与SiamFC算法相比，所提算法的成功率和准确率分别提高了13.5个百分点和13.4个百分点。实验结果表明，所提算法能有效应对目标旋转与尺度变化带来的跟踪挑战。

参考文献 | 相关文章 | 多维度评价

Select

21. 基于双向门控尺度特征融合的遥感场景分类

宋中山, 梁家锐, 郑禄, 刘振宇, 帖军

计算机应用 2021, 41 (9): 2726-2735. DOI: 10.11772/j.issn.1001-9081.2020111778

摘要（396）

PDF （3143KB）（315）

针对遥感影像数据集的图像在形状、纹理和颜色上存在较大差别，以及因拍摄高度和角度不同存在的尺度差异导致遥感场景分类精度不高的问题，提出利用主动旋转聚合来融合不同尺度的特征，并通过双向门控提高底层特征与顶层特征互补性的特征融合补偿卷积神经网络（FAC-CNN）。该网络利用图像金字塔为原始图像生成不同尺度图像后将其输入到分支网络中来提取多尺度特征，并提出主动旋转聚合的方式来融合不同尺度的特征，使融合后的特征具有方向信息，从而提高模型对不同尺度输入以及不同旋转输入的泛化能力，实现模型分类精度的提升。FAC-CNN比基于VGGNet的注意循环卷积网络（ARCNet-VGGNet）和门控双向网络（GBNet）在西北工业大学遥感场景图像分类数据集（NWPU-RESISC）上准确率分别提升了2.05个百分点与2.69个百分点，在航空影像数据集（AID）上准确率分别提升了3.24个百分点与0.86个百分点。实验结果表明，FAC-CNN能有效解决遥感影像数据集存在的问题，提高遥感场景分类的精度。

参考文献 | 相关文章 | 多维度评价

Select

22. 基于深度卷积神经网络和聚类的左右轨道线检测

曾祥银, 郑伯川, 刘丹

计算机应用 2021, 41 (8): 2324-2329. DOI: 10.11772/j.issn.1001-9081.2021030385

摘要（401）

PDF （1502KB）（516）

为了提高铁路轨道线检测的准确率和速度，提出了一种基于深度卷积神经网络（CNN）和聚类的左右轨道线检测方法。首先，处理数据集的标注图像，将原标注图均匀分割成许多网格，每个网格局部区域的轨道线信息用一个像素点代替，从而构成缩小的轨道线标注图；然后，基于缩小后的轨道线标注图，提出了一种新的深度CNN用于轨道线检测；最后，提出一种聚类方法来区分左右轨道线。对于长宽都为1 000像素大小的图片，所提左右轨道线检测方法的检测速度达到155 frame/s，准确率达到96%。实验结果表明，所提方法不仅检测准确率高，而且检测速度快。

参考文献 | 相关文章 | 多维度评价

Select

23. 基于多分辨率生成对抗网络的空间数据不确定性重建方法

管其杰, 张挺, 李德亚, 周绍景, 杜奕

计算机应用 2021, 41 (8): 2306-2311. DOI: 10.11772/j.issn.1001-9081.2020101541

摘要（385）

PDF （1224KB）（323）

在空间数据不确定性重建领域，多点统计法（MPS）得到了广泛的应用，但由于计算成本较高，其适用性受到了影响。通过使用金字塔结构的全卷积生成对抗网络（GAN）模型学习不同分辨率的训练图像，提出了一种基于多分辨率GAN模型的空间数据重建方法。该方法从高分辨率训练图像中捕获细节特征，从低分辨率训练图像中捕获大范围特征，因此该方法重建的图像包含训练图像的全局和局部结构信息，同时保持一定的随机性。把所提算法与MPS中的代表性算法以及应用于空间数据重建的GAN方法进行对比的结果表明，所提方法10次重建的总时间降低了约1 h，其平均孔隙度与训练图像孔隙度的差值降低至0.000 2，并且其变差函数曲线和多点连接性函数（MPC）曲线更接近于训练图像，可见所提算法重建质量更好。

参考文献 | 相关文章 | 多维度评价

Select

24. 基于谱聚类半监督特征选择的功能磁共振成像数据分类

祝承, 赵晓琦, 赵丽萍, 焦玉宏, 朱亚飞, 陈建英, 周伟, 谭颖

计算机应用 2021, 41 (8): 2288-2293. DOI: 10.11772/j.issn.1001-9081.2020101553

摘要（409）

PDF （1318KB）（426）

针对功能磁共振成像（fMRI）数据的高维度小样本问题，提出谱聚类半监督特征选择（SS-FSSC）模型。首先利用先验脑区模板提取时间序列信号；然后选取皮尔逊相关系数与序统计量相关系数（OSCC）描述脑区间的功能连接特征，并对特征进行谱聚类；最后利用基于Constraint得分的特征重要性准则挑选出特征子集，并把这些子集输入支持向量机（SVM）分类器进行分类。实验通过在COBRE精神分裂症公开数据集上重复进行100次五折交叉验证，发现当保留特征数为152时，所提模型对精神分裂症得到最高平均准确率约为77%，最高准确率为95.83%。实验结果分析表明，模型仅保留16个功能连接特征进行分类器训练就能稳定达到70%以上的平均准确率，且所提模型得到的结果中功能连接对应的10个脑区中距状裂皮质（Intracalcarine Cortex）出现频次最高，符合现有对精神分裂症的研究状况。

参考文献 | 相关文章 | 多维度评价

Select

25. 遥感影像变化检测综述

任秋如, 杨文忠, 汪传建, 魏文钰, 钱芸芸

《计算机应用》唯一官方网站 2021, 41 (8): 2294-2305. DOI: 10.11772/j.issn.1001-9081.2020101632

摘要（1144）

PDF （1683KB）（1164）

变化检测作为土地利用/土地覆盖检测的关键技术，其目的是在同一区域不同时期的遥感数据中检测出变化的部分及其类型。针对传统的变化检测方法中存在繁重的人工劳动和检测结果效果差等问题，大量基于遥感影像的变化检测方法被提出。为了深入了解基于遥感影像的变化检测技术以及进一步研究变化检测方法，通过对大量有关变化检测的研究进行整理、分析和比较，对变化检测进行了较为全面的综述。首先阐述了变化检测的发展历程；然后从数据选择及预处理、变化检测技术、后处理及精度评价这三个方面详细归纳了变化检测的研究进展，其中变化检测技术主要从分析单元和比较方法的方面分别进行概括；最后对变化检测各个阶段存在的问题进行了总结并提出了未来的发展方向。

参考文献 | 相关文章 | 多维度评价

Select

26. 非线性约束下的准单应变换图像拼接算法

王怀, 王展青

计算机应用 2021, 41 (8): 2318-2323. DOI: 10.11772/j.issn.1001-9081.2020101637

摘要（373）

PDF （2008KB）（300）

针对准单应变换图像拼接算法造成图像非重叠区域存在纵向投影失真的问题，提出了一种基于非线性约束的图像拼接算法。首先，该算法利用非线性约束来平滑过渡分界线左右的图像区域；然后，利用抛物线方程替换准单应变换的直线方程；最后，利用网格化的方法提高图像纹理映射的速度，并利用基于最佳缝合线的方法融合图像。对于尺寸为1 200像素×1 600像素的图像，所提算法的纹理映射耗时波动范围为4~7 s，并且其斜线结构的平均偏离程度在11~31。与准单应变换图像拼接算法相比较，所提算法的纹理映射的耗时降低了55%~67%，斜线结构的平均偏离程度降低了36%~62%，可见所提算法既矫正了斜线几何结构也提高了图像拼接效率。实验结果表明，所提算法在改善拼接图像视觉效果的方面具有更好的结果。

参考文献 | 相关文章 | 多维度评价

Select

27. 基于深度学习的医学影像分割研究综述

曹玉红, 徐海, 刘荪傲, 王紫霄, 李宏亮

《计算机应用》唯一官方网站 2021, 41 (8): 2273-2287. DOI: 10.11772/j.issn.1001-9081.2020101638

摘要（1969）

PDF （2539KB）（1562）

医学影像分割是计算机辅助诊断中的一项基础且关键的任务，目的在于从像素级别准确识别出目标器官、组织或病变区域。不同于自然场景下的图像，医学影像往往纹理复杂，同时受限于成像技术和成像设备，医学影像噪声大，边界模糊而不易判断。除此之外，对医学影像进行标注极大依赖于医疗专家的认知和经验，因此可用于训练中的标注数据少且存在标注误差。由于上述的医学影像边缘模糊不清、训练数据较少和标注误差较大等特点，基于传统图像分割算法搭建的辅助诊断系统难以满足临床应用的要求。近年来随着卷积神经网络（CNN）在计算机视觉和自然语言处理领域的广泛应用，基于深度学习的医学影像分割算法取得了极大的成功。首先概述了近几年基于深度学习的医学影像分割的研究进展，包括这些医学影像分割算法的基本结构、目标函数和优化方法。随后针对医学影像标注数据有限的问题，对目前半监督条件下医学影像分割的主流工作进行了整理归纳和分析。此外，还介绍了针对标注误差进行不确定度分析的相关工作。最后，总结分析了深度学习医学影像分割的特点并展望了未来的研究趋势。

参考文献 | 相关文章 | 多维度评价

Select

28. 基于人工蜂群与模糊C均值的自适应小波变换的噪声图像分割

石雪松, 李宪华, 孙青, 宋韬

计算机应用 2021, 41 (8): 2312-2317. DOI: 10.11772/j.issn.1001-9081.2020101684

摘要（336）

PDF （3644KB）（307）

针对传统模糊C均值（FCM）聚类算法在处理噪声图像时易受到噪声影响的问题，提出了基于FCM的小波域特征增强的噪声图像分割方法。首先，将噪声图像进行二维小波分解；其次，对近似系数进行边缘增强，同时利用人工蜂群（ABC）优化算法对细节系数进行阈值处理，并将处理后的系数进行小波重构；最后，对重构后的图片使用FCM算法来进行图像分割。选取5幅典型的灰度图像，分别添加高斯噪声和椒盐噪声，使用多种方法进行分割，以分割后图像的峰值信噪比（PSNR）和误分率（ME）作为性能指标，实验结果表明，所提方法分割后的图片相较于传统FCM聚类算法分割方法和粒子群优化（PSO）分割方法分割后的图片在PSNR上最多分别有281%和54%的提升，在ME上最多分别有55%和41%的降低。可见所提出的分割方法较好地保留了图像边缘纹理信息，其抗噪性能与分割性能得到了提升。

参考文献 | 相关文章 | 多维度评价

Select

29. 基于边缘保留分解和改进稀疏表示的医学图像融合

裴春阳, 樊宽刚, 马政

计算机应用 2021, 41 (7): 2092-2099. DOI: 10.11772/j.issn.1001-9081.2020081303

摘要（332）

PDF （4280KB）（493）

针对多模态医学图像融合中容易产生伪影且存在细节缺失的问题，提出一种利用多尺度边缘保留分解和稀疏表示的二尺度多模态医学图像融合方法框架。首先利用边缘保留滤波器对源图像进行多尺度分解，得到源图像的平滑层和细节层。然后，将改进的稀疏表示算法用于融合平滑层，并在此基础上提出一种基于图像块筛选的策略来构建过完备字典的数据集，再利用字典学习算法训练出一种联合字典，同时引入一种多范数的活跃度度量方法选择稀疏系数；细节层的融合则采用自适应加权局部区域能量的融合规则。最后将融合后的平滑层和细节层进行多尺度重构得到融合图像。针对三类不同成像模态的医学图像进行对比实验，结果表明，该方法较其他多尺度变换和稀疏表示的方法能够保留更多显著的边缘特征，对比度也有明显提升，在视觉效果和客观评价上都具有一定优势。

参考文献 | 相关文章 | 多维度评价

Select

30. 基于直觉模糊集和亮度增强的医学图像融合

张林发, 张榆锋, 王琨, 李支尧

计算机应用 2021, 41 (7): 2082-2091. DOI: 10.11772/j.issn.1001-9081.2020101539

摘要（413）

PDF （2743KB）（633）

图像融合技术在计算机辅助诊断中发挥了重要作用。传统融合方法通过设计融合策略来同时解决图像融合中的两个关键问题，即细节提取和能量保存，而这容易造成信息丢失或能量保存度不足。鉴于此，提出了一种对细节提取和能量保存问题进行分别解决的融合方法。该方法的第一部分旨在进行细节提取，首先，使用非下采样剪切波变换（NSST）将源图像分解成低频和高频子带；然后，通过改进的能量策略来融合低频子带，而对于高频子带的融合，提出了一种基于直觉模糊集理论的策略；最后，利用逆NSST来重构图像。而在第二部分里，为了达成能量保存，提出了一种亮度增强方法。在43组图像上验证该方法的性能，并把该方法和主成分分析（PCA）、局部拉普拉斯滤波器（LLF）等其他八种传统融合方法进行对比，两种医学图像融合类型（核磁共振图像（MRI）和正电子发射断层图像（PET）、核磁共振图像（MRI）和单光子发射计算机断层图像（SPECT））的实验结果表明，该方法在视觉质量和互信息（MI）、空间频率（SF）、Q值、平均梯度（AG）、信息熵（EI）和标准差（SD）等客观评价指标上均具有优势，能够提高医学图像融合质量。

参考文献 | 相关文章 | 多维度评价

虚拟专题文章