期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 云计算环境下基于代表点增量层次密度聚类的微博事件检测及跟踪
冯永 韩楠 贾东风
计算机应用    2013, 33 (12): 3559-3562.  
摘要564)      PDF (785KB)(466)    收藏
为从微博服务平台产生的大量实时信息中抽取新闻事件,提出了一套完整的云计算环境下的微博事件检测跟踪算法。首先采用新的基于微博转发数和评论数的权值计算方法,将微博文本表示成向量空间模型;再利用基于代表点的增量层次密度聚类(RIHDBSCAN)算法抽取关键词,最终实现新闻事件的检测和跟踪。针对单一节点无法快速高效地处理海量微博数据的问题,将算法部署在云计算平台Hadoop上。通过在新浪微博平台上获取的真实数据进行实验,结果表明,所提出的权值计算方法比
相关文章 | 多维度评价
2. 结合匹配度和语义相似度的Deep Web查询接口模式匹配
冯永 张洋
计算机应用    2012, 32 (06): 1688-1691.   DOI: 10.3724/SP.J.1087.2012.01688
摘要1132)      PDF (620KB)(561)    收藏
查询接口模式匹配是Deep Web信息集成中的关键部分,双重相关性挖掘方法(DCM)能有效利用关联挖掘方法解决复杂接口模式匹配问题。针对DCM方法在匹配效率、匹配准确性方面的不足,提出了一种基于匹配度和语义相似度的新模式匹配方法。该方法首先使用矩阵存储属性间的关联关系,然后采用匹配度计算属性间的相关度,最后利用语义相似度计算候选匹配的相似性。通过在美国伊利诺斯大学的BAMM数据集上进行实验,所提方法与DCM及其改进方法比较有更高的匹配效率和准确性,表明该方法能更好地处理接口之间模式匹配问题。
相关文章 | 多维度评价
3. 基于概念间边权重的概念相似性计算方法
冯永 张洋
计算机应用    2012, 32 (01): 202-205.   DOI: 10.3724/SP.J.1087.2012.00202
摘要1182)      PDF (613KB)(684)    收藏
介绍了传统的基于距离的相似度计算方法,针对其在距离计算中包含语义信息不充足的现状,提出了一种改进的使用WordNet的基于概念之间边的权重的相似性度量方法。该方法综合考虑了概念在词库中所处层次的深度和密度,即概念的语义丰富程度,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题。实验结果表明,所提方法在Rubenstein数据集上与人工判断有着0.9109的相关性,与其他经典的相似性计算方法相比有着更高的准确性。
参考文献 | 相关文章 | 多维度评价