计算机应用 ›› 2012, Vol. 32 ›› Issue (12): 3529-3533.DOI: 10.3724/SP.J.1087.2012.03529

• 计算机软件技术 • 上一篇    下一篇

基于树编辑距离的工作流距离度量方法

贾楠1,付晓东2,3,黄袁1,刘晓燕1,代志华2   

  1. 1. 昆明理工大学 信息工程与自动化学院,昆明 650500
    2. 昆明理工大学 信息工程与自动化学院,昆明 650500
    3. 云南省计算机技术应用重点实验室,昆明 650500
  • 收稿日期:2012-06-27 修回日期:2012-08-13 发布日期:2012-12-29 出版日期:2012-12-01
  • 通讯作者: 付晓东
  • 作者简介:贾楠(1988-),河北石家庄人,硕士研究生,主要研究方向:服务计算;〓付晓东(1975-),男,云南镇雄人,教授, 博士,CCF会员,主要研究方向:服务计算、决策理论与方法、软件工程;〓黄袁(1987-),男,四川内江人,硕士研究生,主要研究方向:服务计算;〓刘晓燕(1964-),女,云南昆明人,副教授,硕士研究生,主要研究方向:服务计算;〓代志华(1987-),女,山西忻州人,硕士研究生,主要研究方向:服务计算。
  • 基金资助:
    国家自然科学基金资助项目;云南省应用基础研究计划项目;云南省教育厅科研基金重点资助项目

Workflow distance metric based on tree edit distance

JIA Nan1,FU Xiao-dong1,2,HUANG Yuan1,LIU Xiao-yan1,DAI Zhi-hua1   

  1. 1. Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming Yunnan 650500, China
    2. Yunnan Provincial Key Laboratory of Computer Application, Kunming Yunnan 650500, China
  • Received:2012-06-27 Revised:2012-08-13 Online:2012-12-29 Published:2012-12-01
  • Contact: FU Xiao-dong

摘要: 在工作流的发现和聚类等应用中,需要对两个工作流模型的距离进行度量。因此,提出一种计算两个不同结构化工作流的距离定量度量方法。首先介绍了结构化工作流,并将每一个结构化工作流转换为流程结构树;然后基于两个结构树之间的树编辑距离来计算工作流之间的距离及相应相似度。该距离度量方法满足距离度量的3个属性,即同实体不可区分性、对称性和三角不等式性质。这些属性使得该距离度量方法可以在工作流模型管理活动中作为定量分析工具。实验结果表明,基于树编辑距离的工作流度量方法是可行的。同时,与基于邻接矩阵的距离度量方法相比,该方法考虑了不同结构之间的语义距离,有效验证了此方法的合理性。

关键词: 结构化工作流, 结构树, 工作流距离, 树编辑距离, 相似度

Abstract: For various applications in today’s service-oriented enterprise computing systems, such as process-oriented service discovering or clustering, it is necessary to measure the distance between two process models. In this paper, we propose a quantitative measure to calculate the distance or similarity between different structured processes. We first introduce a structured workflow model and transform each process into a process structure tree, and then calculate the process distance and its similarity based on the tree edit distance of two structure trees. The proposed distance metric satisfies three distance measure properties, i.e., identity of indiscernible, symmetry and triangle inequality. These properties make the distance metric can be used as a quantitative tool in effective process model management activities. Experiment studies show that the method is feasible. Compared to the adjacency matrix method, the proposed method is more reasonable due to the semantic distance between different structures is considered.

Key words: structured workflow, structure tree, workflow distance, tree edit distance, similarity

中图分类号: