摘要: 挖掘新能源汽车投诉文本中用户对产品多维度的意见,能够为产品的设计决策提供参考。因投诉文本具有实体密度高、句式冗长等特点,导致当前方面-观点对抽取方法感知方面项与观点项间的关联性不强。针对这一问题,提出一种基于语境增强的方面-观点对抽取模型(AOE-CE),通过融合主题特征与文本特征作为语境表示增强实体间的关联关系。模型由实体识别和关系检测两个模块组成,实体识别先通过预训练模型和词性标注工具编码文本,再利用双向长短期记忆网络(Bi-LSTM)结合多头注意力捕获上下文信息得到文本特征,并将其输至条件随机场(CRF)中得到实体集合。关系检测通过BERT获取主题特征,并将其与文本特征融合获得增强的语境表示,再利用三仿射机制以语境表示为辅助提升实体间的关联关系,最后通过Sigmoid得到抽取结果。实验结果显示,所提方法的准确率、召回率和F1值较SDRN模型分别提升了2.19%、1.08%和1.60%。
中图分类号: