计算机应用 ›› 2014, Vol. 34 ›› Issue (9): 2604-2607.DOI: 10.11772/j.issn.1001-9081.2014.09.2604
陈湘涛,丁平尖,王晶
收稿日期:
2014-03-21
修回日期:
2014-05-16
发布日期:
2014-09-30
出版日期:
2014-09-01
通讯作者:
丁平尖
作者简介:
CHEN Xiangtao,DING Pingjian,WANG Jing
Received:
2014-03-21
Revised:
2014-05-16
Online:
2014-09-30
Published:
2014-09-01
Contact:
DING Pingjian
摘要:
现有的相似性搜索算法通常没有考虑时间因素,为此,提出一种异构信息网中基于元路径的动态相似性搜索算法PDSim。PDSim算法首先计算给定元路径下实体的链接矩阵,得到实体之间的元路径实例数比值,同时基于建立时间的不同,计算其时间差异度;在此基础上针对给定的元路径,获得异构信息网中动态相似性的度量。在多个相似性搜索实例中,PDSim能够捕获到实体随时间变化而产生的兴趣的变化;应用于聚类时,相对于PathSim和PCRW方法,其标准互信息聚类精度可以提高0.17%~9.24%。实验结果表明,PDSim方法与传统的基于链接的相似性搜索算法相比,显著提高了异构信息网中动态相似性搜索的效率和用户满意度,是一种研究实体随时间而发生动态变化的相似性搜索方法。
中图分类号:
陈湘涛 丁平尖 王晶. 异构信息网中基于元路径的动态相似性搜索[J]. 计算机应用, 2014, 34(9): 2604-2607.
CHEN Xiangtao DING Pingjian WANG Jing. Meta path-based dynamic similarity search in heterogeneous information network[J]. Journal of Computer Applications, 2014, 34(9): 2604-2607.
[1]MOHAMMADZADEH H, GOTTRON T, SCHWEIGGERT F, et al.TitleFinder: extracting the headline of news Web pages based on cosine similarity and overlap scoring similarity [C]// Proceedings of the 12th International Workshop on Web Information and Data Management. New York: ACM, 2012: 65-71.
[2]QIAN G, SURAL S, GU Y, et al.Similarity between Euclidean and cosine angle distance for nearest neighbor queries [C]// Proceedings of the 2004 ACM Symposium on Applied Computing. New York: ACM, 2004: 1232-1237.
[3]JEH G, WIDOM J. SimRank: a measure of structural-context similarity [C]// Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2002: 538-543.
[4]XU X, YURUK N, FENG Z, et al.SCAN: an structural clustering algorithm for networks [C]// Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2007: 824-833.
[5]JEH G, WIDOM J. Scaling personalized Web search [C]// Proceedings of the 12th International Conference World Wide Web. New York: ACM, 2003: 271-279.
[6]SUN Y, HAN J, YAN X, et al.PathSim: Meta path-based top-k similarity search in heterogeneous information networks [C]// Proceedings of the 37th International Conference on Very Large Data Bases. New York: ACM, 2011: 992-1003.
[7]LAO N, COHEN W. Fast query execution for retrieval models based on path constrained random walks [C]// Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2010: 881-888.
[8]SUN Y, HAN J, AGGARWAL C, et al.When will it happen? — Relationship prediction in heterogeneous information network [C]// Proceedings of the Fifth ACM International Conference on Web Search and Data Mining. New York: ACM, 2012: 663-672.
[9]YU X, SUN Y, NORICK B, et al.User guided entity similarity search using meta-path selection in heterogeneous information network [C]// Proceedings of the 21st ACM International Conference on Information and Knowledge Management. New York: ACM, 2012: 2025-2029.
[10]SHI C, KONG X, YU P, et al.Relevance search in heterogeneous networks [C]// Proceedings of the 15th International Conference on Extending Database Technology. New York: ACM, 2012: 180-191.
[11]JI M, SUN Y, DANILEVSKY M, et al.Graph regularized transductive classification on heterogeneous information networks [C]// Proceedings of the 21th European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases. Berlin: Springer-Verlag, 2010: 570-586.
[12]SUN Y, HAN J, ZHAO P, et al.RankClus: integrating clustering with ranking for heterogeneous information network analysis [C]// Proceedings of the 12th International Conference on Extending Database Technology. New York: ACM, 2009: 565-576.
[13]SHI J, MALIK J. Normalized cuts and image segmentation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22(8): 888-905. |
[1] | 张庆 杨凡 方宇涵. 基于多模态信息融合的中文拼写纠错算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 高颖杰, 林民, 斯日古楞null, 李斌, 张树钧. 基于片段抽取原型网络的古籍文本断句标点提示学习方法[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3815-3822. |
[3] | 王猛 张大千 周冰艳 马倩影 吕继东. 基于时序知识图谱补全的CTCS-3级列控车载接口设备故障诊断方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[4] | 杨青 朱焱. 改进语言规则中的表示的隐喻识别技术[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[5] | 余婧 陈艳平 扈应 黄瑞章 秦永彬. 结合实体边界偏移的序列标注优化方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[6] | 张伟 牛家祥 马继超 沈琼霞. 深层语义特征增强的ReLM中文拼写纠错模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[7] | 徐章杰 陈艳平 扈应 黄瑞章 秦永彬. 联合边界生成的多目标学习嵌套命名实体识别[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[8] | 代震龙 韩萌 杨文艳 朱诗能 杨书蓉. 序列模式挖掘综述[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[9] | 徐乐 黄瑞章 白瑞娜 秦永彬. 基于意图正则化的深度半监督文本聚类[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[10] | 彭一峰 朱焱. 结合预处理方法和对抗学习的公平链接预测[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[11] | 赵彪 秦玉华 田荣坤 胡月航 陈芳锐. 依赖类型及距离增强的方面级情感分析模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[12] | 任登燃 王淑营. 基于差分边界增强的风电装备嵌套实体识别模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[13] | 田海燕 黄赛豪 张栋 李寿山. 视觉指导的分词和词性标注[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[14] | 帅健 王中卿 陈嘉沥. 基于代码生成的细粒度情感分析方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[15] | 姜雨杉, 张仰森. 大语言模型驱动的立场感知事实核查[J]. 《计算机应用》唯一官方网站, 2024, 44(10): 3067-3073. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||