计算机应用 ›› 2014, Vol. 34 ›› Issue (9): 2566-2570.DOI: 10.11772/j.issn.1001-9081.2014.09.2566
收稿日期:
2014-04-02
修回日期:
2014-05-04
出版日期:
2014-09-01
发布日期:
2014-09-30
通讯作者:
解忠乾
作者简介:
基金资助:
国家自然科学基金重点项目
XIE Zhongqian1,CHANG Xiao2,JI Donghong1
Received:
2014-04-02
Revised:
2014-05-04
Online:
2014-09-01
Published:
2014-09-30
Contact:
XIE Zhongqian
摘要:
搜索引擎触发广告的过程中,需要实时计算拍卖词(Bidword)和用户查询(Query)的相关性,广告语境下的Term动态赋权方式和短语商业价值评估成为相关性计算必须考虑的问题。为此引入广告主行为,结合连续词袋模型(CBOW),提出了一种广告语境下的短语相关计算方法ADPCB。首先通过CBOW模型获得短语中每个Term的向量;然后分析广告主行为,构建关于短语的全局赋权树,对短语结构进行分析得到Term的动态权重;最后将Term权重和向量线性组合产生短语的向量表示,用于Bidword和Query的相关性度量。对10000对带有标签的Query和Bidword(正负比例1∶〖KG-*2〗1)利用Word2vec进行实验,ADPCB比结合CBOW模型的TF-IDF效果更好;而在准确率达到0.70时,ADPCB比潜在狄利克雷分布(LDA)、BM25和TF-IDF获得了更高的召回率。结果表明ADPCB提高了触发Bidword和Query的相关性,同时可以量化短语中Term的商业价值属性,减少低商业价值Query的广告触发数量,可应用于实时计算的场景。
中图分类号:
解忠乾 常笑 姬东鸿. 融合广告主行为的拍卖词实时触发[J]. 计算机应用, 2014, 34(9): 2566-2570.
XIE Zhongqian CHANG Xiao JI Donghong. Real-time advertising trigger with advertiser behavioral analysis[J]. Journal of Computer Applications, 2014, 34(9): 2566-2570.
[1]ZHOU A, ZHOU M, GONG X. Computational advertising: a data-centric comprehensive Web application [J]. Chinese Journal of Computers, 2011, 34(10): 1805-1819. (周傲英,周敏奇,宫学庆.计算广告:以数据为核心的Web综合应用[J].计算机学报, 2011,34(10):1805-1819.)
[2]CASTELLS P, FERNANDEZ M, VALLET D. An adaptation of the vector-space model for ontology-based information retrieval [J]. IEEE Transactions on Knowledge and Data Engineering, 2007, 19(2): 261-272.
[3]ZHU Z, SUN J. Improved vocabulary semantic similarity calculation based on HowNet [J]. Journal of Computer Applications, 2013, 33(8):2276-2279. (朱征宇,孙俊华. 改进的基于〖WW)〗《〖WW(〗知网〖WW)〗》〖WW(〗的词汇语义相似度计算[J]. 计算机应用,2013,33(8):2276-2279.)
[4]LI B, LIU T, QIN B, et al.Chinese sentence similarity computing based on semantic dependency relationship analysis [J]. Application Research of Computers, 2004, 20(12):15-17. (李彬,刘挺,秦兵,等.基于语义依存的汉语句子相似度计算[J].计算机应用研究,2004, 20(12):15-17.)
[5]CARPINETO C, ROMANO G. A survey of automatic query expansion in information retrieval [J]. ACM Computing Surveys (CSUR),2012,44(1):1-56.
[6]HOFMANN T. Learning the similarity of documents: an information-geometric approach to document retrieval and categorization [C]// NIPS 1999: Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2000: 914-920.
[7]HOFFMAN M D, BLEI D M, BACH F R. Online learning for latent Dirichlet allocation [C]// NIPS 2010: Proceedings of the 24th Annual Conference on Neural Information Processing Systems. Vancouver: NIPS, 2010: 856-864.
[8]MIKOLOV T, CHEN K, CORRADO G S, et al.Efficient estimation of word representations in vector space [C/OL]// Proceedings of the 2013 Workshop at ICLR, arXiv: 1301.3781. (2013-09-07) [2014-02-06]. http://arxiv.org/abs/1301.3781.
[9]MIKOLOV T, SUTSKEVER I, CHEN K, et al.Distributed representations of words and phrases and their compositionality [C]// NIPS 2013: Proceedings of the 2013 Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2013: 3111-3119.
[10]ROBERTSON S. Understanding inverse document frequency: on theoretical arguments for IDF [J]. Journal of Documentation, 2004, 60(5): 503-520.
[11]HILLARD D, SCHROEDL S, MANAVOGLU E, et al.Improving ad relevance in sponsored search [C]// Proceedings of the third ACM International Conference on Web Search and Data Mining. New York: ACM, 2010: 361-370.
[12]CHANG Y C, HILL M L. Query rewrite with auxiliary attributes in query processing operations: U.S. Patent Application 13/346,366 [P]. 2012-01-09.
[13]MORIN F, BENGIO Y. Hierarchical probabilistic neural network language model [C]// Proceedings of the International Workshop on Artificial Intelligence and Statistics. Cambridge: Cambridge University Press, 2005: 246-252.
[14]BENGIO Y, SCHWENK H, SENCAL J S, et al.Neural probabilistic language models [M]// Innovations in Machine Learning. Berlin: Springer-Verlag, 2006: 137-186.
[15]GOTTIPATI S, JIANG J. Linking entities to a knowledge base with query expansion [C]// EMNLP '11: Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing. Stroudsburg: Association for Computational Linguistics, 2011: 804-813.
[16]BRODER A, CIARAMITA M, FONTOURA M, et al.To swing or not to swing: learning when (not) to advertise [C]// Proceedings of the 17th ACM Conference on Information and Knowledge Management. New York: ACM, 2008: 1003-1012. |
[1] | 吴军 欧阳艾嘉 张琳. 基于影响度的统计显著序列模式挖掘算法[J]. 计算机应用, 0, (): 0-0. |
[2] | 张璐 方春 祝铭. 基于Res2Net-YOLACT和融合特征的室内跌倒检测算法[J]. 计算机应用, 0, (): 0-0. |
[3] | 殷雨昌 王洪元 陈莉 冯尊登 肖宇. 基于单标注样本的多损失学习与联合度量视频行人重识别[J]. 计算机应用, 0, (): 0-0. |
[4] | 胡军 许正康 刘立 钟福金 张清华. 融合多粒度社区信息的网络嵌入方法[J]. 计算机应用, 0, (): 0-0. |
[5] | 李润泽 孙雪姣. 基于时间条件提取序列的数据流偏好查询[J]. 计算机应用, 0, (): 0-0. |
[6] | 罗圣钦 陈金怡 李洪均. 基于注意力机制的多尺度残差UNet实现乳腺癌灶分割[J]. 计算机应用, 0, (): 0-0. |
[7] | 曹一珉 蔡磊 高敬阳. 基于生成对抗网络的基因数据生成方法[J]. 计算机应用, 0, (): 0-0. |
[8] | 陈冲 闫珠 赵继轩 何为 梁华庆. 基于集合经验模态分解和长短期记忆网络的催化裂化装置NOx排放预测[J]. 计算机应用, 0, (): 0-0. |
[9] | 徐光柱 林文杰 陈莎 匡婉 雷帮军 周军. U-Net与自适应阈值脉冲耦合神经网络相结合的眼底血管分割方法[J]. 计算机应用, 0, (): 0-0. |
[10] | 杨鼎康 黄帅 王顺利 翟鹏 李一丹 张立华. 基于对抗生成网络和网络集成的面部表情识别方法EE-GAN[J]. 计算机应用, 0, (): 0-0. |
[11] | 李讷 徐光柱 雷帮军 马国亮 石勇涛. 交通道路行驶车辆车标识别算法[J]. 计算机应用, 0, (): 0-0. |
[12] | 孟杰 王莉 杨延杰 廉飚. 基于多模态深度融合的虚假信息检测[J]. 计算机应用, 0, (): 0-0. |
[13] | 秦庭威 赵鹏程 秦品乐 曾建朝 柴锐 黄永琦. 基于残差注意力机制的点云配准算法[J]. 计算机应用, 0, (): 0-0. |
[14] | 鲁永帅 唐英杰 马鑫然. 基于深度特征融合的无纺布低对比度浆丝缺陷检测方法[J]. 计算机应用, 0, (): 0-0. |
[15] | 王宇航 周永霞 吴良武. 基于高斯函数的池化算法[J]. 计算机应用, 0, (): 0-0. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||