计算机应用

• 数据库技术(Database technology) • 上一篇    下一篇

基于XML的完全频繁查询模式挖掘算法

陈超祥 叶时平 华成 金林樵   

  1. 浙江树人大学 信息科技学院 浙江树人大学 信息科技学院 浙江大学 计算机科学与技术学院 浙江树人大学 信息科技学院
  • 收稿日期:2007-12-04 修回日期:1900-01-01 出版日期:2008-06-01 发布日期:2008-06-01
  • 通讯作者: 陈超祥

XML-based mining algorithm of complete frequent query pattern

Chao-xiang CHEN Shi-ping YE Cheng HUA Lin-qiao JIN   

  • Received:2007-12-04 Revised:1900-01-01 Online:2008-06-01 Published:2008-06-01
  • Contact: Chao-xiang CHEN

摘要: 使用树结构建模对XML查询进行研究,提出了一种基于树同构的查询包含检测方法。采用最右分枝扩展方法,系统地枚举查询模式树的同根子树。在枚举过程中,采用Diffset结构记录包含同根子树的事务集的查询事务标识,并给出挖掘算法DiffFRSTMiner。实验结果证实了该算法合理、高效,并可以减少一定的内存开销。

关键词: XML, 数据挖掘, 频繁查询模式

Abstract: To study XML query with tree structure modeling, a query and detection method based on tree isomorphism was proposed, systematically enumerating the same root subtree of query pattern tree with the most right branch expansion. In the enumeration process, the Diffset data structure was used to record the query item logo of item set, and the DiffFRSTMiner mining algorithm was proposed. This item set includes the same root subtree. The experimental results prove that the algorithm is efficient, and can reduce definite memory overhead.

Key words: XML, data mining, frequent query pattern