计算机应用 ›› 2014, Vol. 34 ›› Issue (9): 2566-2570.DOI: 10.11772/j.issn.1001-9081.2014.09.2566
解忠乾1,常笑2,姬东鸿1
收稿日期:
2014-04-02
修回日期:
2014-05-04
发布日期:
2014-09-30
出版日期:
2014-09-01
通讯作者:
解忠乾
作者简介:
基金资助:
国家自然科学基金重点项目
XIE Zhongqian1,CHANG Xiao2,JI Donghong1
Received:
2014-04-02
Revised:
2014-05-04
Online:
2014-09-30
Published:
2014-09-01
Contact:
XIE Zhongqian
摘要:
搜索引擎触发广告的过程中,需要实时计算拍卖词(Bidword)和用户查询(Query)的相关性,广告语境下的Term动态赋权方式和短语商业价值评估成为相关性计算必须考虑的问题。为此引入广告主行为,结合连续词袋模型(CBOW),提出了一种广告语境下的短语相关计算方法ADPCB。首先通过CBOW模型获得短语中每个Term的向量;然后分析广告主行为,构建关于短语的全局赋权树,对短语结构进行分析得到Term的动态权重;最后将Term权重和向量线性组合产生短语的向量表示,用于Bidword和Query的相关性度量。对10000对带有标签的Query和Bidword(正负比例1∶〖KG-*2〗1)利用Word2vec进行实验,ADPCB比结合CBOW模型的TF-IDF效果更好;而在准确率达到0.70时,ADPCB比潜在狄利克雷分布(LDA)、BM25和TF-IDF获得了更高的召回率。结果表明ADPCB提高了触发Bidword和Query的相关性,同时可以量化短语中Term的商业价值属性,减少低商业价值Query的广告触发数量,可应用于实时计算的场景。
中图分类号:
解忠乾 常笑 姬东鸿. 融合广告主行为的拍卖词实时触发[J]. 计算机应用, 2014, 34(9): 2566-2570.
XIE Zhongqian CHANG Xiao JI Donghong. Real-time advertising trigger with advertiser behavioral analysis[J]. Journal of Computer Applications, 2014, 34(9): 2566-2570.
[1]ZHOU A, ZHOU M, GONG X. Computational advertising: a data-centric comprehensive Web application [J]. Chinese Journal of Computers, 2011, 34(10): 1805-1819. (周傲英,周敏奇,宫学庆.计算广告:以数据为核心的Web综合应用[J].计算机学报, 2011,34(10):1805-1819.)
[2]CASTELLS P, FERNANDEZ M, VALLET D. An adaptation of the vector-space model for ontology-based information retrieval [J]. IEEE Transactions on Knowledge and Data Engineering, 2007, 19(2): 261-272.
[3]ZHU Z, SUN J. Improved vocabulary semantic similarity calculation based on HowNet [J]. Journal of Computer Applications, 2013, 33(8):2276-2279. (朱征宇,孙俊华. 改进的基于〖WW)〗《〖WW(〗知网〖WW)〗》〖WW(〗的词汇语义相似度计算[J]. 计算机应用,2013,33(8):2276-2279.)
[4]LI B, LIU T, QIN B, et al.Chinese sentence similarity computing based on semantic dependency relationship analysis [J]. Application Research of Computers, 2004, 20(12):15-17. (李彬,刘挺,秦兵,等.基于语义依存的汉语句子相似度计算[J].计算机应用研究,2004, 20(12):15-17.)
[5]CARPINETO C, ROMANO G. A survey of automatic query expansion in information retrieval [J]. ACM Computing Surveys (CSUR),2012,44(1):1-56.
[6]HOFMANN T. Learning the similarity of documents: an information-geometric approach to document retrieval and categorization [C]// NIPS 1999: Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2000: 914-920.
[7]HOFFMAN M D, BLEI D M, BACH F R. Online learning for latent Dirichlet allocation [C]// NIPS 2010: Proceedings of the 24th Annual Conference on Neural Information Processing Systems. Vancouver: NIPS, 2010: 856-864.
[8]MIKOLOV T, CHEN K, CORRADO G S, et al.Efficient estimation of word representations in vector space [C/OL]// Proceedings of the 2013 Workshop at ICLR, arXiv: 1301.3781. (2013-09-07) [2014-02-06]. http://arxiv.org/abs/1301.3781.
[9]MIKOLOV T, SUTSKEVER I, CHEN K, et al.Distributed representations of words and phrases and their compositionality [C]// NIPS 2013: Proceedings of the 2013 Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2013: 3111-3119.
[10]ROBERTSON S. Understanding inverse document frequency: on theoretical arguments for IDF [J]. Journal of Documentation, 2004, 60(5): 503-520.
[11]HILLARD D, SCHROEDL S, MANAVOGLU E, et al.Improving ad relevance in sponsored search [C]// Proceedings of the third ACM International Conference on Web Search and Data Mining. New York: ACM, 2010: 361-370.
[12]CHANG Y C, HILL M L. Query rewrite with auxiliary attributes in query processing operations: U.S. Patent Application 13/346,366 [P]. 2012-01-09.
[13]MORIN F, BENGIO Y. Hierarchical probabilistic neural network language model [C]// Proceedings of the International Workshop on Artificial Intelligence and Statistics. Cambridge: Cambridge University Press, 2005: 246-252.
[14]BENGIO Y, SCHWENK H, SENCAL J S, et al.Neural probabilistic language models [M]// Innovations in Machine Learning. Berlin: Springer-Verlag, 2006: 137-186.
[15]GOTTIPATI S, JIANG J. Linking entities to a knowledge base with query expansion [C]// EMNLP '11: Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing. Stroudsburg: Association for Computational Linguistics, 2011: 804-813.
[16]BRODER A, CIARAMITA M, FONTOURA M, et al.To swing or not to swing: learning when (not) to advertise [C]// Proceedings of the 17th ACM Conference on Information and Knowledge Management. New York: ACM, 2008: 1003-1012. |
[1] | 张佳慧 李晓明 张嘉祥. 强化形态感知的路面缺陷检测算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 杨建锋 陈斌 李雨轩. 基于点云重构的自监督点云异常检测方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[3] | 薛振华 李强 黄超. 视觉大模型驱动的像素级图像异常检测模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[4] | 蒋畅江 向杰 何旭颖. 面向机械臂抓取的双目视觉目标定位算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[5] | 边小勇 胡其仁 袁培洋. 多注意力对比学习的红外小目标检测[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[6] | 李钟华 钟庚辛 范萍 朱恒亮. 通过边界挖掘和背景引导的伪装目标检测[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[7] | 吴松霖 张广朝 姚远 彭博. 基于判别区域引导的多视图困难气道识别[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[8] | 李强 白少雄 熊源 袁薇. 基于视觉大模型隐私保护的监控图像定位[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[9] | 薛雅丽 徐忠敏 刘世豪. 基于多级小波残差网络的重力数据去噪方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[10] | 况世雄 姚俊波 陆佳炜 王琪冰 肖刚. 基于动态图卷积网络的电梯乘客异常行为数据增强方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[11] | 康斌 陈斌 王俊杰 李昱林 赵军智 咸伟志. 基于多粒度共享语义中心关联的文本到人物检索方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[12] | 张庆 杨凡 方宇涵. 基于多模态信息融合的中文拼写纠错算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[13] | 王昊 王金伟 程鑫 张家伟 吴昊 罗向阳 马宾. 彩色图像JPEG重压缩取证综述[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[14] | 王磊 胡节 彭博. 用于半监督火灾检测的分布自适应和动态课程伪标签框架[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[15] | 刘晋文 王磊 马博 董瑞 杨雅婷 艾合塔木江·艾合麦提 王欣乐. 基于弱监督模态语义增强的多模态有害信息检测方法 [J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||