摘要: 针对当前主流神经网络在处理答案选择任务时无法同时满足句子的充分表示以及句子间信息充分交互的问题,提出了一种动态注意力以及多角度匹配的方法(DAMPM)。先调用语言模型的词嵌入方法(ELMo预训练模型)获得包含简单语义信息的词向量,然后在注意力层采用过滤机制有效的去除句子中的噪音,得到问句和答案句的句子表征。其次,在匹配层同时引入多种匹配策略完成句子向量之间的信息交互。最后采用双向长短期记忆网络(BiLSTM)将匹配层获得的句子向量进行拼接后计算句子相似度。在文本检索会议问答(TRECQA)数据集上的实验结果表明,与基线模型中基于比较聚合框架中的最优算法---动态滑动注意力算法(DCAN)相比,DAMPM在平均准确率均值(MAP)和平均倒排名(MRR)两个性能指标上均提高了1.6%。其次,在维基百科问答(WIKIQA)数据集上的实验结果表明,DAMPM相比DCAN在两个性能指标上分别提高了0.7%和0.3%。总的实验结果表明,DAMPM相比基线模型整体上有更好的性能表现。
中图分类号: