《计算机应用》唯一官方网站 ›› 0, Vol. ›› Issue (): 61-65.DOI: 10.11772/j.issn.1001-9081.2023111687
Yang GAO, Han LI(), Weihe ZHONG
摘要:
针对化工安全问题,化工安全事故命名实体识别(NER)可以有效识别事故发生地点、何种化学品参与事故以及致使此事故发生的人员等信息。然而,化工安全事故领域NER中的信息多样且不能充分利用词信息。为解决这些问题,提出使用SoftLexicon的lattice长短时记忆(LSTM)网络结合自注意力机制的融合网络模型。首先,将输入句子扩展到字符级别,并在引入词信息的过程中结合外部词典资源构造字符特征;其次,将字符特征放进引入自注意力机制的Lattice-LSTM-CRF(Conditional Random Field)层,并结合预训练模型BERT(Bidirectional Encoder Representations from Transformers)进行实体识别。实验结果表明,所提模型在化工数据集上的F1分数达到88.61%,在微博和简历公开数据集上的指标值优于字级BiLSTM-CRF、Lattice-LSTM等主流模型。可见,所提模型可以有效完成化工安全事故领域的NER任务。
中图分类号: