一种两层加权融合的排序算法

doi:10.3724/SP.J.1087.2012.03331

计算机应用 ›› 2012, Vol. 32 ›› Issue (12): 3331-3334.DOI: 10.3724/SP.J.1087.2012.03331

一种两层加权融合的排序算法

胡小生,钟勇

佛山科学技术学院电子与信息工程学院, 广东佛山 528000

收稿日期:2012-06-28 修回日期:2012-08-13 发布日期:2012-12-29 出版日期:2012-12-01
通讯作者: 胡小生
作者简介:胡小生（1978-），男，湖北黄冈人，讲师，高级工程师，主要研究方向：信息检索、机器学习；〓钟勇（1970-），男，江西吉安人，教授，博士，主要研究方向：信息安全、信息检索、云计算。
基金资助:
广东省科技计划项目(2010B020315028);佛山市科技发展专项资金项目

Two-tier weighting aggregation ranking algorithm

HU Xiao-sheng,ZHONG Yong

College of Electronic and Information Engineering, Foshan University, Foshan Guangdong 528000, China

Received:2012-06-28 Revised:2012-08-13 Online:2012-12-29 Published:2012-12-01
Contact: HU Xiao-sheng

摘要/Abstract

摘要： 当前排序学习算法在学习时将样本集中的所有查询及其相关文档等同对待，忽略了查询之间以及其相关文档之间的差异性，影响了排序模型的性能。对查询之间的差异进行分析，同时考虑文档排序位置造成的资料被检视概率不同的差异特性，提出了一种两层加权融合的排序方法。该方法为每一个查询及其相关文档建立一个子排序模型，在此过程中，对文档赋予非对称权重，然后通过建立新的损失函数作为优化目标，利用损失函数调节不同查询产生损失之间的权重，最终实现多查询相关排序模型的加权融合。在标准数据集LETOR OHSUMED上的实验结果表明，所提方法在排序性能上有较大提升。

关键词: 信息检索, 排序学习, 非对称加权, 融合

Abstract: In ranking for document retrieval, queries often vary greatly from one another. However, most of the existing ranking methods do not consider significant differences between queries. Correctly ranking documents on the top of the result list is crucial, and one must conduct training in a way that such ranked results are accurate. A two-tier weighting aggregation ranking method was proposed. This method consisted of two steps, training of base rankers and query-level ranker aggregation. First, base rankers were established based on each query, assigning asymmetric weights to its relevant documents, then, query-level ranker aggregation used a supervised approach to learn query-dependent weights when these base rankers were combined. The experimental results on the benchmark data set LETRO ONHSUMED show that the ranking performance has been significantly improved.

Key words: information retrieval, learing to rank, asymmetric weighting, aggregation

中图分类号:

TP391

胡小生钟勇. 一种两层加权融合的排序算法[J]. 计算机应用, 2012, 32(12): 3331-3334.

HU Xiao-sheng ZHONG Yong. Two-tier weighting aggregation ranking algorithm[J]. Journal of Computer Applications, 2012, 32(12): 3331-3334.

[1]	黄颖, 杨佳宇, 金家昊, 万邦睿. 用于RGBT跟踪的孪生混合信息融合算法[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2878-2885.
[2]	王娜, 蒋林, 李远成, 朱筠. 基于图形重写和融合探索的张量虚拟机算符融合优化[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2802-2809.
[3]	潘烨新, 杨哲. 基于多级特征双向融合的小目标检测优化模型[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2871-2877.
[4]	陈彤, 杨丰玉, 熊宇, 严荭, 邱福星. 基于多尺度频率通道注意力融合的声纹库构建方法[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2407-2413.
[5]	刘艺, 杨国利, 郑奇斌, 李翔, 周杨森, 陈德鹏. 无人系统数据融合流水线架构设计[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2536-2543.
[6]	李晨倩, 刘俊. 基于半监督和多尺度级联注意力的超声颈动脉斑块分割方法[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2604-2610.
[7]	顾焰杰, 张英俊, 刘晓倩, 周围, 孙威. 基于时空多图融合的交通流量预测[J]. 《计算机应用》唯一官方网站, 2024, 44(8): 2618-2625.
[8]	魏文亮, 王阳萍, 岳彪, 王安政, 张哲. 基于光照权重分配和注意力的红外与可见光图像融合深度学习模型[J]. 《计算机应用》唯一官方网站, 2024, 44(7): 2183-2191.
[9]	刘瑞华, 郝子赫, 邹洋杨. 基于多层级精细特征融合的步态识别算法[J]. 《计算机应用》唯一官方网站, 2024, 44(7): 2250-2257.
[10]	李伟, 张晓蓉, 陈鹏, 李清, 张长青. 基于正态逆伽马分布的多尺度融合人群计数算法[J]. 《计算机应用》唯一官方网站, 2024, 44(7): 2243-2249.
[11]	刘越, 刘芳, 武奥运, 柴秋月, 王天笑. 基于自注意力机制与图卷积的3D目标检测网络[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1972-1977.
[12]	罗玮, 刘金全, 张铮. 融合秘密分享技术的双重纵向联邦学习框架[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1872-1879.
[13]	王美, 苏雪松, 刘佳, 殷若南, 黄珊. 时频域多尺度交叉注意力融合的时间序列分类方法[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1842-1847.
[14]	赵征宇, 罗景, 涂新辉. 基于多粒度语义融合的信息检索方法[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1775-1780.
[15]	黄梦源, 常侃, 凌铭阳, 韦新杰, 覃团发. 基于层间引导的低光照图像渐进增强算法[J]. 《计算机应用》唯一官方网站, 2024, 44(6): 1911-1919.

一种两层加权融合的排序算法

Two-tier weighting aggregation ranking algorithm

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics