• • 下一篇
基于弱监督模态语义增强的多模态有害信息检测方法
刘晋文1,2,3, 王磊1,2,3*, 马博1,2,3, 董瑞1,2,3, 杨雅婷1,2,3, 艾合塔木江·艾合麦提1,2,3, 王欣乐4
摘要: 社交媒体上多模态有害信息的泛滥,不仅侵害公众利益,还严重扰乱社会秩序,亟需有效的检测方法。现有研究依赖预训练模型提取与融合多模态特征,忽视了通用语义在有害信息检测任务中的局限性,且未能充分考虑有害信息复杂多变的组合形式。为此,提出一种基于弱监督模态语义增强的多模态有害信息检测方法(weak-S),所提方法通过引入弱监督模态信息辅助多模态特征的有害语义对齐,并设计一种低秩双线性池化的多模态门控集成机制,以区分不同信息的贡献度。实验结果表明,所提方法在HarmP和MuitiOFF等公开基准数据集上的F1值相较于SOTA(State-Of-The-Art)模型分别提高了2.2和3.2个百分点,验证了弱监督模态语义在多模态有害信息检测中的重要性。此外,所提方法还在多模态夸张检测任务上取得了1个百分点的泛化性能提升。
中图分类号: