《计算机应用》唯一官方网站 ›› 2024, Vol. 44 ›› Issue (2): 469-476.DOI: 10.11772/j.issn.1001-9081.2023020180
所属专题: 数据科学与技术
收稿日期:
2023-02-27
修回日期:
2023-04-20
接受日期:
2023-05-04
发布日期:
2024-02-22
出版日期:
2024-02-10
通讯作者:
郭浩
作者简介:
荆智文(1997—),男,山西运城人,硕士研究生,主要研究方向:推荐系统、深度学习基金资助:
Zhiwen JING, Yujia ZHANG, Boting SUN, Hao GUO()
Received:
2023-02-27
Revised:
2023-04-20
Accepted:
2023-05-04
Online:
2024-02-22
Published:
2024-02-10
Contact:
Hao GUO
About author:
JING Zhiwen, born in 1997, M. S. candidate. His research interests include recommendation system, deep learning.Supported by:
摘要:
针对推荐系统中双塔型神经网络难以学习用户侧和商品侧交互信息以及图连接信息的问题,提出一种二阶段孪生卷积神经网络推荐算法(TSN)。首先,以用户行为构建异质图;然后,在双塔型神经网络之间设计图卷积孪生网络,从而在学习异质图连接信息的同时进行信息交互;最后,通过设计特殊结构的二阶段孪生信息共享机制,使得用户侧和商品侧的神经网络在训练过程中能够动态地、双向地传输信息,且有效避免神经网络串联。在基于MovieLens和豆瓣电影数据集的对比实验中,NDCG@10、NDCG@50、NDCG@100相较于最优基准算法DAT(Dual Augmented Two-tower model for online large-scale recommendation)提升了11.39%~23.98%。结果表明,所提算法能够缓解双塔型神经网络缺乏信息交互的问题,较对比算法推荐性能提升显著。
中图分类号:
荆智文, 张屿佳, 孙伯廷, 郭浩. 二阶段孪生图卷积神经网络推荐算法[J]. 计算机应用, 2024, 44(2): 469-476.
Zhiwen JING, Yujia ZHANG, Boting SUN, Hao GUO. Two-stage recommendation algorithm of Siamese graph convolutional neural network[J]. Journal of Computer Applications, 2024, 44(2): 469-476.
符号 | 定义 |
---|---|
用户集合 | |
商品集合 | |
用户 | |
用户及商品文档集合 | |
用户 | |
商品 | |
用户侧深度神经网络输出的特征矩阵 | |
商品侧深度神经网络输出的特征矩阵 | |
评分矩阵 | |
单个用户子图 | |
深度神经网络参数矩阵 | |
孪生卷积神经网络参数矩阵 |
表1 重要符号定义
Tab. 1 Definition of important notations
符号 | 定义 |
---|---|
用户集合 | |
商品集合 | |
用户 | |
用户及商品文档集合 | |
用户 | |
商品 | |
用户侧深度神经网络输出的特征矩阵 | |
商品侧深度神经网络输出的特征矩阵 | |
评分矩阵 | |
单个用户子图 | |
深度神经网络参数矩阵 | |
孪生卷积神经网络参数矩阵 |
数据集 | 用户数 | 商品数 | 评分数 | 评分范围 |
---|---|---|---|---|
MovieLens | 10 000 | 9 395 | 1 462 905 | [0.5, 5] |
豆瓣电影 | 2 712 | 34 893 | 1 278 401 | [ |
表2 实验数据集统计信息
Tab. 2 Statistics of experimental datasets
数据集 | 用户数 | 商品数 | 评分数 | 评分范围 |
---|---|---|---|---|
MovieLens | 10 000 | 9 395 | 1 462 905 | [0.5, 5] |
豆瓣电影 | 2 712 | 34 893 | 1 278 401 | [ |
模型 | HR@N | NDCG@N | MRR@N | ||||||
---|---|---|---|---|---|---|---|---|---|
N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | |
TF⁃IDF | 0.013 4 | 0.024 2 | 0.035 9 | 0.021 3 | 0.044 2 | 0.052 2 | 0.035 1 | 0.047 9 | 0.068 9 |
FM | 0.018 9 | 0.040 6 | 0.063 4 | 0.031 2 | 0.050 3 | 0.065 9 | 0.058 9 | 0.063 6 | 0.071 2 |
YoutubeDNN | 0.021 2 | 0.037 8 | 0.059 9 | 0.030 3 | 0.048 7 | 0.059 3 | 0.052 4 | 0.059 1 | 0.072 3 |
DSSM | 0.029 4 | 0.046 4 | 0.073 2 | 0.037 5 | 0.058 7 | 0.067 3 | 0.062 5 | 0.069 7 | 0.082 1 |
STAN | 0.033 2 | 0.048 8 | 0.077 5 | 0.043 0 | 0.062 9 | 0.073 3 | 0.067 5 | 0.075 8 | 0.087 4 |
HIRS | 0.034 9 | 0.049 9 | 0.080 3 | 0.045 7 | 0.064 6 | 0.076 9 | 0.068 6 | 0.078 8 | 0.089 4 |
DAT | 0.038 8 | 0.051 9 | 0.083 6 | 0.053 6 | 0.068 8 | 0.082 4 | 0.071 1 | 0.081 4 | 0.092 3 |
TSN(GC) | 0.040 3 | 0.055 2 | 0.087 9 | 0.056 8 | 0.072 2 | 0.092 9 | 0.074 1 | 0.080 2 | 0.093 6 |
表3 各算法在MovieLens数据集的实验结果
Tab. 3 Experimental results of different models on MovieLens dataset
模型 | HR@N | NDCG@N | MRR@N | ||||||
---|---|---|---|---|---|---|---|---|---|
N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | |
TF⁃IDF | 0.013 4 | 0.024 2 | 0.035 9 | 0.021 3 | 0.044 2 | 0.052 2 | 0.035 1 | 0.047 9 | 0.068 9 |
FM | 0.018 9 | 0.040 6 | 0.063 4 | 0.031 2 | 0.050 3 | 0.065 9 | 0.058 9 | 0.063 6 | 0.071 2 |
YoutubeDNN | 0.021 2 | 0.037 8 | 0.059 9 | 0.030 3 | 0.048 7 | 0.059 3 | 0.052 4 | 0.059 1 | 0.072 3 |
DSSM | 0.029 4 | 0.046 4 | 0.073 2 | 0.037 5 | 0.058 7 | 0.067 3 | 0.062 5 | 0.069 7 | 0.082 1 |
STAN | 0.033 2 | 0.048 8 | 0.077 5 | 0.043 0 | 0.062 9 | 0.073 3 | 0.067 5 | 0.075 8 | 0.087 4 |
HIRS | 0.034 9 | 0.049 9 | 0.080 3 | 0.045 7 | 0.064 6 | 0.076 9 | 0.068 6 | 0.078 8 | 0.089 4 |
DAT | 0.038 8 | 0.051 9 | 0.083 6 | 0.053 6 | 0.068 8 | 0.082 4 | 0.071 1 | 0.081 4 | 0.092 3 |
TSN(GC) | 0.040 3 | 0.055 2 | 0.087 9 | 0.056 8 | 0.072 2 | 0.092 9 | 0.074 1 | 0.080 2 | 0.093 6 |
模型 | HR@N | NDCG@N | MRR@N | ||||||
---|---|---|---|---|---|---|---|---|---|
N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | |
TF⁃IDF | 0.016 7 | 0.023 2 | 0.031 7 | 0.012 1 | 0.020 4 | 0.028 9 | 0.015 2 | 0.022 7 | 0.031 1 |
FM | 0.022 9 | 0.030 4 | 0.042 2 | 0.019 7 | 0.027 3 | 0.040 2 | 0.022 9 | 0.030 2 | 0.043 1 |
YoutubeDNN | 0.034 4 | 0.046 7 | 0.050 3 | 0.024 4 | 0.035 6 | 0.047 7 | 0.033 4 | 0.041 4 | 0.050 7 |
DSSM | 0.051 1 | 0.060 3 | 0.065 9 | 0.033 2 | 0.046 5 | 0.052 6 | 0.049 7 | 0.050 3 | 0.055 8 |
STAN | 0.052 9 | 0.066 7 | 0.068 7 | 0.039 0 | 0.051 6 | 0.060 9 | 0.050 8 | 0.054 4 | 0.062 9 |
HIRS | 0.054 9 | 0.068 1 | 0.071 1 | 0.041 3 | 0.053 9 | 0.062 2 | 0.052 7 | 0.056 6 | 0.064 7 |
DAT | 0.059 4 | 0.071 1 | 0.077 2 | 0.046 7 | 0.067 6 | 0.068 6 | 0.056 6 | 0.067 6 | 0.069 6 |
TSN(GC) | 0.065 3 | 0.078 7 | 0.083 9 | 0.057 9 | 0.075 3 | 0.078 8 | 0.067 0 | 0.074 5 | 0.079 8 |
表4 各算法在豆瓣电影数据集的实验结果
Tab. 4 Experimental results of different models on Douban movie dataset
模型 | HR@N | NDCG@N | MRR@N | ||||||
---|---|---|---|---|---|---|---|---|---|
N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | |
TF⁃IDF | 0.016 7 | 0.023 2 | 0.031 7 | 0.012 1 | 0.020 4 | 0.028 9 | 0.015 2 | 0.022 7 | 0.031 1 |
FM | 0.022 9 | 0.030 4 | 0.042 2 | 0.019 7 | 0.027 3 | 0.040 2 | 0.022 9 | 0.030 2 | 0.043 1 |
YoutubeDNN | 0.034 4 | 0.046 7 | 0.050 3 | 0.024 4 | 0.035 6 | 0.047 7 | 0.033 4 | 0.041 4 | 0.050 7 |
DSSM | 0.051 1 | 0.060 3 | 0.065 9 | 0.033 2 | 0.046 5 | 0.052 6 | 0.049 7 | 0.050 3 | 0.055 8 |
STAN | 0.052 9 | 0.066 7 | 0.068 7 | 0.039 0 | 0.051 6 | 0.060 9 | 0.050 8 | 0.054 4 | 0.062 9 |
HIRS | 0.054 9 | 0.068 1 | 0.071 1 | 0.041 3 | 0.053 9 | 0.062 2 | 0.052 7 | 0.056 6 | 0.064 7 |
DAT | 0.059 4 | 0.071 1 | 0.077 2 | 0.046 7 | 0.067 6 | 0.068 6 | 0.056 6 | 0.067 6 | 0.069 6 |
TSN(GC) | 0.065 3 | 0.078 7 | 0.083 9 | 0.057 9 | 0.075 3 | 0.078 8 | 0.067 0 | 0.074 5 | 0.079 8 |
模型 | HR@N | NDCG@N | MRR@N | ||||||
---|---|---|---|---|---|---|---|---|---|
N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | |
TSN(w/o TS,GC) | 0.032 2 | 0.044 5 | 0.049 6 | 0.022 1 | 0.033 9 | 0.043 5 | 0.031 2 | 0.038 7 | 0.047 5 |
TSN(U⁃GC) | 0.057 3 | 0.067 4 | 0.071 2 | 0.045 5 | 0.060 6 | 0.062 3 | 0.056 4 | 0.057 6 | 0.064 1 |
TSN(I⁃GC) | 0.055 2 | 0.063 3 | 0.070 2 | 0.045 9 | 0.061 7 | 0.063 3 | 0.054 8 | 0.057 9 | 0.062 7 |
TSN(TS) | 0.065 0 | 0.079 4 | 0.082 1 | 0.057 6 | 0.075 0 | 0.077 5 | 0.066 7 | 0.074 1 | 0.080 7 |
TSN(GC) | 0.065 3 | 0.078 7 | 0.083 9 | 0.057 9 | 0.075 3 | 0.078 8 | 0.067 0 | 0.074 5 | 0.079 8 |
表5 TSN(GC)及其变体在豆瓣电影数据集的实验结果
Tab. 5 Experimental results of TSN(GC) and its variants on Douban movie dataset
模型 | HR@N | NDCG@N | MRR@N | ||||||
---|---|---|---|---|---|---|---|---|---|
N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | N=10 | N=50 | N=100 | |
TSN(w/o TS,GC) | 0.032 2 | 0.044 5 | 0.049 6 | 0.022 1 | 0.033 9 | 0.043 5 | 0.031 2 | 0.038 7 | 0.047 5 |
TSN(U⁃GC) | 0.057 3 | 0.067 4 | 0.071 2 | 0.045 5 | 0.060 6 | 0.062 3 | 0.056 4 | 0.057 6 | 0.064 1 |
TSN(I⁃GC) | 0.055 2 | 0.063 3 | 0.070 2 | 0.045 9 | 0.061 7 | 0.063 3 | 0.054 8 | 0.057 9 | 0.062 7 |
TSN(TS) | 0.065 0 | 0.079 4 | 0.082 1 | 0.057 6 | 0.075 0 | 0.077 5 | 0.066 7 | 0.074 1 | 0.080 7 |
TSN(GC) | 0.065 3 | 0.078 7 | 0.083 9 | 0.057 9 | 0.075 3 | 0.078 8 | 0.067 0 | 0.074 5 | 0.079 8 |
1 | 赵俊逸,庄福振,敖翔,等. 协同过滤推荐系统综述[J]. 信息安全学报, 2021, 6(5):17-34. 10.19363/J.cnki.cn10-1380/tn.2021.09.02 |
ZHAO J Y, ZHUANG F Z, AO X, et al. Survey of collaborative filtering recommender systems[J]. Journal of Cyber Security, 2021, 6(5):17-34. 10.19363/J.cnki.cn10-1380/tn.2021.09.02 | |
2 | KO H, LEE S, PARK Y, et al. A survey of recommendation systems: recommendation models, techniques, and application fields[J]. Electronics, 2022, 11(1): No.141. 10.3390/electronics11010141 |
3 | HUANG P S, HE X, GAO J, et al. Learning deep structured semantic models for web search using clickthrough data[C]// Proceedings of the 22nd ACM International Conference on Information & Knowledge Management. New York: ACM, 2013: 2333-2338. 10.1145/2505515.2505665 |
4 | YU Y, WANG W, FENG Z, et al. A dual augmented two-tower model for online large-scale recommendation[EB/OL]. [2023-01-20].. |
5 | BROMLEY J, GUYON I, LeCUN Y, et al. Signature verification using a “Siamese” time delay neural network[C]// Proceedings of the 6th International Conference on Neural Information Processing Systems. San Francisco: Morgan Kaufmann Publishers Inc., 1993: 737-744. 10.1142/9789812797926_0003 |
6 | 王梦亭,杨文忠,武雍智. 基于孪生网络的单目标跟踪算法综述[J]. 计算机应用, 2023, 43(3):661-673. 10.11772/j.issn.1001-9081.2022010150 |
WANG M T, YANG W Z, WU Y Z. Survey of single target tracking algorithms based on Siamese networks[J]. Journal of Computer Applications, 2023, 43(3):661-673. 10.11772/j.issn.1001-9081.2022010150 | |
7 | VINEELA A, LAVANYA DEVI G, NELATURI N, et al. A comprehensive study and evaluation of recommender systems[C]// Proceedings of the 5th ICMEET 2019. Singapore: Springer, 2021: 45-53. 10.1007/978-981-15-3828-5_5 |
8 | SANTOS C F G D, PAPA J P. Avoiding overfitting: a survey on regularization methods for convolutional neural networks[J]. ACM Computing Surveys, 2022, 54(10s): No.213. 10.1145/3510413 |
9 | CONG S, ZHOU Y. A review of convolutional neural network architectures and their optimizations[J]. Artificial Intelligence Review, 2023, 56(3): 1905-1969. 10.1007/s10462-022-10213-5 |
10 | ABBAS S, ALHWAITI Y, FATIMA A, et al. Convolutional neural network based intelligent handwritten document recognition[J]. Computers, Materials and Continua, 2022, 70(3): 4563-4581. 10.32604/cmc.2022.021102 |
11 | MA C, MA L, ZHANG Y, et al. Memory augmented graph neural networks for sequential recommendation[C]// Proceedings of the 34th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2020: 5045-5052. 10.1609/aaai.v34i04.5945 |
12 | YANG Y, RAO Y, YU M, et al. Multi-layer information fusion based on graph convolutional network for knowledge-driven herb recommendation[J]. Neural Networks, 2022, 146: 1-10. 10.1016/j.neunet.2021.11.010 |
13 | LIU Z, YANG L, FAN Z, et al. Federated social recommendation with graph neural network[J]. ACM Transactions on Intelligent Systems and Technology, 2022, 13(4): No.55. 10.1145/3501815 |
14 | SU Y, ZHAO Y, ERFANI S, et al. Detecting arbitrary order beneficial feature interactions for recommender systems[C]// Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. New York: ACM, 2022: 1676-1686. 10.1145/3534678.3539238 |
15 | ALAM M T, UBAID S, SOHAIL S S, et al. Comparative analysis of machine learning based filtering techniques using MovieLens dataset[J]. Procedia Computer Science, 2021, 194: 210-217. 10.1016/j.procs.2021.10.075 |
16 | YU H, FU M. DbRMP: predicting Douban rating of movies with high-dimensional features by comprehensive machine learning algorithms[C]// Proceedings of the 2022 IEEE International Conference on Artificial Intelligence and Computer Applications. Piscataway: IEEE, 2022: 540-544. 10.1109/icaica54878.2022.9844633 |
17 | AIZAWA A. An information-theoretic perspective of TF-IDF measures[J]. Information Processing and Management, 2003, 39(1): 45-65. 10.1016/s0306-4573(02)00021-3 |
18 | RENDLE S. Factorization machines[C]// Proceedings of the 2010 IEEE International Conference on Data Mining. Piscataway: IEEE, 2010: 995-1000. 10.1109/icdm.2010.127 |
19 | COVINGTON P, ADAMS J, SARGIN E. Deep neural networks for YouTube recommendations[C]// Proceedings of the 10th ACM Conference on Recommender Systems. New York: ACM, 2016: 191-198. 10.1145/2959100.2959190 |
20 | LUO Y, LIU Q, LIU Z. STAN: spatio-temporal attention network for next location recommendation[C]// Proceedings of the Web Conference 2021. Republic and Canton of Geneva: International World Wide Web Conferences Steering Committee, 2021: 2177-2185. 10.1145/3442381.3449998 |
21 | JANNACH D, MANZOOR A, CAI W, et al. A survey on conversational recommender systems[J]. ACM Computing Surveys, 2022, 54(5): No.105. 10.1145/3453154 |
22 | KO H, LEE S, PARK Y, et al. A survey of recommendation systems: recommendation models, techniques, and application fields[J]. Electronics, 2022, 11(1): No.141. 10.3390/electronics11010141 |
[1] | 秦璟, 秦志光, 李发礼, 彭悦恒. 基于概率稀疏自注意力神经网络的重性抑郁疾患诊断[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2970-2974. |
[2] | 王熙源, 张战成, 徐少康, 张宝成, 罗晓清, 胡伏原. 面向手术导航3D/2D配准的无监督跨域迁移网络[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2911-2918. |
[3] | 李顺勇, 李师毅, 胥瑞, 赵兴旺. 基于自注意力融合的不完整多视图聚类算法[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2696-2703. |
[4] | 潘烨新, 杨哲. 基于多级特征双向融合的小目标检测优化模型[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2871-2877. |
[5] | 李云, 王富铕, 井佩光, 王粟, 肖澳. 基于不确定度感知的帧关联短视频事件检测方法[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2903-2910. |
[6] | 唐廷杰, 黄佳进, 秦进. 基于图辅助学习的会话推荐[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2711-2718. |
[7] | 黄云川, 江永全, 黄骏涛, 杨燕. 基于元图同构网络的分子毒性预测[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2964-2969. |
[8] | 陈虹, 齐兵, 金海波, 武聪, 张立昂. 融合1D-CNN与BiGRU的类不平衡流量异常检测[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2493-2499. |
[9] | 赵宇博, 张丽萍, 闫盛, 侯敏, 高茂. 基于改进分段卷积神经网络和知识蒸馏的学科知识实体间关系抽取[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2421-2429. |
[10] | 唐廷杰, 黄佳进, 秦进, 陆辉. 基于图共现增强多层感知机的会话推荐[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2357-2364. |
[11] | 张春雪, 仇丽青, 孙承爱, 荆彩霞. 基于两阶段动态兴趣识别的购买行为预测模型[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2365-2371. |
[12] | 刘禹含, 吉根林, 张红苹. 基于骨架图与混合注意力的视频行人异常检测方法[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2551-2557. |
[13] | 顾焰杰, 张英俊, 刘晓倩, 周围, 孙威. 基于时空多图融合的交通流量预测[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2618-2625. |
[14] | 石乾宏, 杨燕, 江永全, 欧阳小草, 范武波, 陈强, 姜涛, 李媛. 面向空气质量预测的多粒度突变拟合网络[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2643-2650. |
[15] | 吴筝, 程志友, 汪真天, 汪传建, 王胜, 许辉. 基于深度学习的患者麻醉复苏过程中的头部运动幅度分类方法[J]. 《计算机应用》唯一官方网站, 2024, 44(7): 2258-2263. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||