%0 Journal Article %A 丛琳 %A 李岩芳 %A 邱宁佳 %A 王鹏 %A 周思丞 %T 结合改进主动学习的SVD-CNN弹幕文本分类算法 %D 2019 %R 10.11772/j.issn.1001-9081.2018081757 %J 计算机应用 %P 644-650 %V 39 %N 3 %X 为解决传统卷积神经网络(CNN)模型使用池化层进行文本特征降维会损失较多文本语义信息的问题,提出一种基于奇异值分解(SVD)算法的卷积神经网络模型(SVD-CNN)。首先,采用改进的基于密度中心点采样的主动学习算法(DBC-AL)选择对分类模型贡献率较高的样本进行标注,以低标注代价获得高质量模型训练集;然后,结合SVD算法建立SVD-CNN弹幕文本分类模型,使用奇异值分解的方法代替传统CNN模型池化层进行特征提取和降维,并在此基础上完成弹幕文本分类任务;最后,使用改进的梯度下降算法(PSGD)对模型参数进行优化。为了验证改进算法的有效性,使用多种弹幕数据样本集,对提出的模型与常用的文本分类模型进行对比实验。实验结果表明,改进的算法能够更好地保留文本语义特征,保证训练过程的稳定性并提高了模型的收敛速度,在不同的弹幕文本上较传统算法具有更好的分类性能。 %U http://www.joca.cn/CN/10.11772/j.issn.1001-9081.2018081757