计算机应用 ›› 2011, Vol. 31 ›› Issue (03): 683-685.DOI: 10.3724/SP.J.1087.2011.00683

• 数据库技术 • 上一篇    下一篇

数据集成中基于组合相似度计算的属性映射搜索算法

郑凯1,梁卓明2,郑文栋2   

  1. 1. 华南师范大学 教育信息技术学院,广州510631;华南师范大学 网络中心,广州510631
    2. 华南师范大学 网络中心,广州510631
  • 收稿日期:2010-09-06 修回日期:2010-10-29 发布日期:2011-03-03 出版日期:2011-03-01
  • 通讯作者: 郑凯
  • 作者简介:郑凯(1978-),男,浙江舟山人,系统分析师,博士研究生,主要研究方向:计算机网络与教育应用;梁卓明(1977-),男,广东江门人,系统分析师,主要研究方向:计算机网络与教育应用;郑文栋(1980-),男,广东湛江人,工程师,主要研究方向:计算机网络与教育应用。
  • 基金资助:
    国家科技支撑计划子课题基金资助项目(2008BAH37B05084)

Attribute mapping search algorithm based on combined similarity calculation in data integration

ZHENG Kai1,LIANG Zhuo-ming2,ZHENG Wen-dong2   

  1. 1. School of Education Information Technology, South China Normal University, Guangzhou Guangdong 510631, China; Network Center, South China Normal University, Guangzhou Guangdong 510631, China
    2. Network Center, South China Normal University, Guangzhou Guangdong 510631, China
  • Received:2010-09-06 Revised:2010-10-29 Online:2011-03-03 Published:2011-03-01
  • Contact: ZHENG Kai

摘要: 针对企业数据物化集成中属性映射技术存在的问题,提出了基于组合相似度计算的属性映射搜索算法(SACS)。通过建立直观的属性相似度计算因子和组合公式,在数据源属性间遍历搜索映射关系,从而规避传统属性映射技术在机器学习过程中数据样本的选择问题,提高属性映射关系的查准率和查全率。

关键词: 数据集成, 属性映射, 相似度计算, 遍历搜索

Abstract: In view of the problem of attribute mapping techniques in materialized data integration, the authors proposed a search algorithm of attribute mapping based on combined similarity calculation (SACS). The proposed algorithm was established through intuitive calculation factors and combined formula to traverses attribute mapping in data sources. The algorithm avoids the sample selection problem of machine learning in traditional attribute mapping techniques, and improves the precision rate and recall rate for attribute mapping.

Key words: data integration, attribute mapping, traversal search

中图分类号: