《计算机应用》唯一官方网站 ›› 2022, Vol. 42 ›› Issue (11): 3364-3370.DOI: 10.11772/j.issn.1001-9081.2022010045
所属专题: 第九届CCF大数据学术会议(CCF Bigdata 2021)
解伟凡1,2, 郭岩1(), 匡广生1,3, 余智华1, 薛源海1, 沈华伟1
Weifan XIE1,2, Yan GUO1(), Guangsheng KUANG1,3, Zhihua YU1, Yuanhai XUE1, Huawei SHEN1
摘要:
针对以往流行度预测方法未利用演化模式之间的差异和忽略预测时效性的问题,提出了一种基于演化模式的推特话题流行度预测方法。首先,基于K?SC算法对大量历史话题的流行度序列进行聚类,并得到6类演化模式;然后,使用各类演化模式下的历史话题数据分别训练全连接网络(FCN)作为预测模型;最后,为选择待预测话题的预测模型,提出幅度对齐的动态时间规整(AADTW)算法来计算待预测话题的已知流行度序列与各演化模式的相似度,并选取相似度最高的演化模式的预测模型进行流行度预测。在根据已知前20 h的流行度预测后5 h的流行度的任务中,与差分整合移动平均自回归(ARIMA)方法以及使用单一的全连接网络进行预测的方法相比,所提方法的预测结果的平均绝对百分比误差(MAPE)分别降低了58.2%和31.0%。实验结果表明,基于演化模式得到的模型群相较于单一模型能更加准确地预测推特话题流行度。
中图分类号: