• • 下一篇
蒋章涛,李欣,张士豪,赵心阳
JIANG Zhangtao, LI Xin, ZHANG
Shihao, ZHAO Xinyang
摘要: 在微博等社交媒体的舆情发现和预测中,网络水军制造的“假热点”会影响分析准确性。为真实反映微博舆情热度,提出一种融合BERT和X-means算法的微博舆情热度分析预测模型BXpre。首先,对微博原文和互动用户数据进行预处理,利用微调后的StructBERT模型分别对这些数据进行分类,从而确定参与互动用户与微博原文的关联度,作为用户对该微博热度增长贡献度权重计算的参考值;其次,基于X-means算法,以互动用户特征为依据进行聚类,根据聚集态的同质性特征进行水军过滤,并引入针对水军样本的权重惩罚机制,结合标签关联度,进一步构建微博热度指标模型;最后,模型通过计算先验热度值随时间变化的二阶导数与真实数据的余弦相似度预测未来微博热度变化。BXpre旨在融合微博参与用户的属性特征与热度变化时域特征,提高热度预测的准确性。实验结果表明,BXpre融合微博参与用户的属性特征与热度变化时域特征,在不同用户量级下输出的微博舆情热度排序结果更贴近真实数据,量级混合测试条件下,预测相关性指标达90.88%。较三种传统方法,平均提升了12.94个百分点,相较ChatGPT和文心一言,预测相关性指标提升了9.76和11.95个百分点。
中图分类号: