期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法
邢金彪, 崔超远, 孙丙宇, 宋良图
计算机应用    2016, 36 (8): 2257-2261.   DOI: 10.11772/j.issn.1001-9081.2016.08.2257
摘要440)      PDF (842KB)(425)    收藏
传统的微博广告过滤方法忽略了微博广告文本的数据稀疏性、语义信息和广告背景领域特征等因素的影响。针对这些问题,提出一种基于隐含狄列克雷分配(LDA)分类特征扩展的广告过滤方法。首先,将微博分为正常微博和广告型微博,并分别构建LDA主题模型预测短文本对应的主题分布,将主题中的词作为特征扩展的基础;其次,在特征扩展时结合文本类别信息提取背景领域特征,以降低其对文本分类的影响;最后,将扩展后的特征向量作为分类器的输入,根据支持向量机(SVM)的分类结果过滤广告。实验结果表明,与现有的仅基于短文本分类的过滤方法相比,其准确率平均提升4个百分点。因此,该方法能有效扩展文本特征,并降低背景领域特征的影响,更适用于数据量较大的微博广告过滤。
参考文献 | 相关文章 | 多维度评价
2. 因特网舆情传播的协同元胞自动机模型
方薇 何留进 宋良图
计算机应用    2012, 32 (02): 399-402.   DOI: 10.3724/SP.J.1087.2012.00399
摘要1362)      PDF (619KB)(594)    收藏
现有的因特网舆情传播研究或者从话题文本增长—消亡过程的数学统计或智能学习出发,或者采用元胞自动机或隐马尔可夫模型(HMM)分析主题倾向度的演化过程。但这些研究均缺乏有关舆情主体属性对因特网舆情传播影响的分析。基于因特网舆情空间的系统协同性,首先计算元胞状态协同转移概率,同时将整体协同转移概率与中心元胞之九邻居局域状态概率比较,确定中心元胞状态是否转换。经过若干次时间序列的迭代计算,获得舆情整体传播趋向“+”或“-”的程度(磁化率)。通过观察磁化率—时间变化曲线,能清楚地了解舆情传播的演化。在此基础上,提出一个扩展的协同元胞自动机模型及算法。仿真结果表明环境适应度参变量表达了网络舆情主体从众心理,其变化影响磁化率向多数人意见靠拢;而偏好参变量使网络舆情整体快速向“偏好”方向传播。该模型比较接近现实社会网络的舆情传播方式。
参考文献 | 相关文章 | 多维度评价