摘要: 高校招生在线咨询通常采用人工回复或基于关键词匹配的问答系统来处理,常常存在人工回复效率低下,问答系统答非所问的问题。此外,咨询文本往往比较简短,文本向量化表示易导致高维稀疏问题。针对上述问题,提出一种基于栈式降噪稀疏自编码网络(SDSAE)的招生咨询算法。首先,利用自编码网络对短文本进行特征提取和降维,引入数据集增强技术和添加噪声技术解决训练样本规模较小且分类不均问题,提高算法的泛化能力;获得短文本低维特征表示后,结合BP算法对文本进行分类。本文提出的算法分类效果优于BP、SVM、ELM等算法,能显著提高招生咨询文本的分类效果,为高校设计制作智能咨询系统提供了一种新途径,在高校招生咨询领域有良好的应用前景。
中图分类号: