针对数字图像拍摄过程中因远近视野聚焦不当所导致的半聚焦图像问题,提出一种级联融合与增强重建的多聚焦图像融合网络(CasNet)。首先,构建级联采样模块对不同深度采样特征图的残差进行计算与合并,从而高效利用不同尺度下的聚焦特征;其次,改进轻量化多头自注意力机制以计算特征图的维度残差,从而完成图像的特征增强,并使特征图在不同维度上呈现更优分布;再次,使用卷积通道注意力堆叠完成特征重建;最后,在采样过程中使用分隔卷积进行上下采样,从而保留更多的图像原有特征。实验结果表明,在多聚焦图像基准测试集Lytro、MFFW、grayscale和MFI-WHU上,CasNet相较于SESF-Fuse(Spatially Enhanced Spatial Frequency-based Fusion)和U2Fusion(Unified Unsupervised Fusion network)等热门方法在平均梯度(AG)、灰度级差(GLD)等指标上都取得了较好的结果。