基于注意力机制的改进CLSM检索式匹配问答方法研究

• •

基于注意力机制的改进CLSM检索式匹配问答方法研究

于重重¹,曹帅²,潘博²,张青川³,徐世璇⁴

1. 北京工商大学计算机与信息工程学院，北京100048
2. 北京工商大学
3. 北京科技大学计算机与通信工程学院
4. 中国社会科学院

收稿日期:2018-08-15 修回日期:2018-11-02 发布日期:2018-11-02
通讯作者: 于重重

Retrieval Matching Question-and-Answer method based on improved CLSM

Received:2018-08-15 Revised:2018-11-02 Online:2018-11-02
Contact: YU Chongchong

摘要/Abstract

摘要： 传统检索式匹配问答系统在对问句和候选答案进行特征抽取时使用了一些较为粗糙的方法, 忽略了句子的语义信息，直接影响了问答结果的准确性。近年来，随着人工智能大潮的又一次兴起，基于卷积神经网络的潜在语义模型(Convolutional Latent Semantic Model, CLSM)在提取句子语义特征方面取得了不错的效果。针对中文匹配问答任务，该文在传统CLSM模型上进行改进，去掉了N元模型层，设计了基于CLSM的中文文本语义特征提取模型，改进了传统CLSM模型对中文文本适应性弱的缺点；并引入了实体关注层，对句子中的核心词汇的语义信息进行加强。同时设计了三组对比实验，实验结果显示改进模型较传统翻译模型在NDCG方面有4%-10%的提升。验证了所建模型能够通过实体关注层加强核心词的信息，同时利用卷积神经网络有效地捕获语义匹配有用的上下文结构方面信息，从而提升检索式匹配问答的准确率。

关键词: CLSM, 注意力机制, 检索式匹配问答

Abstract: The traditional Retrieval Matching Question and Answer model (RMQA) uses some old methods in the feature extraction of questions and candidate answers, which ignores the semantic information of sentences and affects the accuracy of question and answer results substantially. Recently, the Convolutional Latent Semantic Model (CLSM) has got good results in extracting sentence semantic features. As for RMQA task, we drop the word-n-gram layer and letter-n-gram layer of the CLSM to build a CLSM-based semantic feature extraction model. And we also propose an entity_attention layer to balance the matrix’s value of important entity. We design three groups of contrast experiments, the experimental results showed that the improved model had a 4%-10% improvement over the traditional translation model in NDCG. It is proved that the model can strengthen the information of the core word through the entity concern layer, and use the convolution neural network to capture the useful contextual structure information of semantic matching effectively so as to improve the accuracy of the retrieval matching question and answer.

Key words: CLSM, Attention, RMQA

于重重曹帅潘博张青川徐世璇. 基于注意力机制的改进CLSM检索式匹配问答方法研究[J]. 计算机应用.

[1]	郭洁, 林佳瑜, 梁祖红, 罗孝波, 孙海涛. 基于知识感知和跨层次对比学习的推荐方法[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1121-1127.
[2]	张鹏飞, 韩李涛, 冯恒健, 李洪梅. 基于注意力机制和全局特征优化的点云语义分割[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1086-1092.
[3]	袁泉, 陈昌平, 陈泽, 詹林峰. 基于BERT的两次注意力机制远程监督关系抽取[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1080-1085.
[4]	尤昕源, 王恒. 基于门控膨胀卷积循环网络的单声道语音增强[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1317-1324.
[5]	黄荣, 宋俊杰, 周树波, 刘浩. 基于自监督视觉Transformer的图像美学质量评价方法[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1269-1276.
[6]	肖斌, 甘昀, 汪敏, 张兴鹏, 王照星. 基于端口注意力与通道空间注意力的网络异常流量检测[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1027-1034.
[7]	杨先凤, 汤依磊, 李自强. 基于交替注意力机制和图卷积网络的方面级情感分析模型[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1058-1064.
[8]	王海涵, 朱焱. 融合反讽机制的攻击性言论检测[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1065-1071.
[9]	陈天华, 朱家煊, 印杰. 基于注意力机制的鸟类识别算法[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1114-1120.
[10]	许立君, 黎辉, 刘祖阳, 陈侃松, 马为駽. 基于3D‑Ghost卷积神经网络的脑胶质瘤MRI图像分割算法3D‑GA‑Unet[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1294-1302.
[11]	孙滔, 段张甜, 朱浩楠, 郭沛豪, 孙鹤立. 基于新奇度量的社交事件推荐方法[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 760-766.
[12]	董永峰, 白佳明, 王利琴, 王旭. 融合先验知识和字形特征的中文命名实体识别[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 702-708.
[13]	江锐, 刘威, 陈成, 卢涛. 非对称端到端的无监督图像去雨网络[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 922-930.
[14]	郑宇亮, 陈云华, 白伟杰, 陈平华. 融合事件数据和图像帧的车辆目标检测[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 931-937.
[15]	赵奎, 仇慧琪, 李旭, 徐知非. 结合注意力和多路径融合的实时肺结节检测算法[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 945-952.