• • 下一篇
吴松霖1,张广朝2,姚远3,彭博1
摘要: 困难气道(DA)是临床手术中关键的术前风险因素,但它的准确识别面临诸多挑战,如数据集规模小、类别严重不平衡以及单视图识别能力不足等。为解决这些限制,提出多视图DA识别模型——DRG-MV-Net (Discriminative Region Guided Multi-View Net)。在模型第一阶段,判别区域引导模块(DRGM)借助类激活映射(CAM)自动检测并强调面部视图中的关键判别区域,生成具有特定特征的两种数据增强图像。在第二阶段,以集成扩张卷积块注意模块(D-CBAM)的ResNet-18骨干网络提取每个视图的特征,随后通过多视图交叉融合模块(MCFM)进行多视图特征集成。将Focal Loss与分层混合采样相结合,缓解类别不平衡问题。对所构建的临床数据集评估显示,所提模型实现了77.22%的几何平均准确率(G-Mean)、43.88%的F1-Score、38.73%的马修斯相关系数(MCC)和0.7407的受试者操作特征曲线下面积(AUC)。与近期相关研究的方法MCE-Net(Multi-view Contrastive representation prior and Ensemble classification Network)相比,G-Mean、F1-Score、MCC,分别提升了2.41、2.34和3.41个百分点;与基线模型ResNet-18相比,分别提升了4.85、6.85、8.25个百分点,验证了所提方法在小型、不平衡数据集中DA识别的有效性,为解决复杂的DA识别任务提供了新的见解和方法。
中图分类号: