摘要: 摘 要: 聚合函数的近似查询处理(AQP)是近年来数据库领域的研究热点,针对现有的近似查询技术存在查询响应时间长、存储开销大、不支持多谓词查询等问题,提出一种基于深度自回归模型的近似查询处理方法(DeepAQP),使用深度自回归模型对表中多列数据的联合概率分布进行建模,并估计查询谓词限定下的选择度和目标列的概率分布,可以有效处理单表下的多谓词聚合函数近似查询请求。在TPC-H和TPC-DS数据集上进行实验:与基于采样的VerdictDB方法相比,查询响应时间减少了2-3个数量级,存储空间减少了3个数量级;与基于传统机器学习模型的DBEst++方法相比,查询响应速度亦减少了1个数量级,显著降低了模型训练耗时,并且可以处理前者所不支持的多谓词查询请求。实验结果表明,DeepAQP兼顾了查询精度和速度,并显著降低了算法在训练和存储上的开销。
中图分类号: