基于关系型数据的混合因果模型学习算法

doi:10.11772/j.issn.1001-9081.2025111450

《计算机应用》唯一官方网站

• • 下一篇

基于关系型数据的混合因果模型学习算法

闫琳¹,²,钱宇华³,刘赛雄⁴,李珏¹

1. 山西大学大数据科学与产业研究院
2. 演化科学智能山西省重点实验室
3. 山西大学
4. 山西大学大数据科学与产业研究院、山西大学演化科学智能山西省重点实验室

收稿日期:2025-12-08 修回日期:2026-01-31 接受日期:2026-02-03 发布日期:2026-02-10 出版日期:2026-02-10
通讯作者: 钱宇华
基金资助:
国家自然科学基金重点项目

Hybrid Causal Model Learning Algorithm Based on Relational Data

Received:2025-12-08 Revised:2026-01-31 Accepted:2026-02-03 Online:2026-02-10 Published:2026-02-10
Supported by:
National Natural Science Foundation of China

摘要/Abstract

摘要： 摘要: 真实世界中的关系涉及多种实体类型间的交互，关系因果模型(RCM)形象地刻画了这类关系。研究如何从关系因果模型中学习因果关系对复杂场景中的业务决策具有重要意义。现有算法大多依赖于先验知识(Oracle)的关系条件独立性检验来建立和确定因果关系，无法从关系型数据中学习因果；而已有的从关系型数据中学习因果的算法采用基于约束的方式，受到有限数据样本量的限制，导致其算法召回率和F1分数不是很高。基于上述问题，本文提出约束和打分相结合的混合算法(RCSH)。该算法首先通过启发式算法获取无向依赖，构建无向关系因果模型；然后利用关系双变量定向规则(RBO)对该关系因果模型进行定向，在限制搜索空间之后，引入贪婪爬山算法，缓解了已有算法在有限数据量样本下的对长关系路径和多属性依赖的低敏感性问题。合成数据集上的实验结果表明，与鲁棒关系因果发现算法(RRCD)相比，RCSH算法的召回率提升了约12.8%，F1分数提高了约3.31%，且随着数据规模的增大表现出稳步提升的趋势。同时，RCSH算法在真实数据集上也验证了其适用性与有效性。

关键词: 关键词: 关系因果模型, 结构学习, 因果发现, 关系型数据, 混合算法

Abstract: Abstract: Relationships in the real world involve interactions among various entity types, and Relational Causal Model (RCM) provides a clear depiction of such relationships. Learning causal relationships from relational causal model is crucial for supporting business decision-making in complex scenarios. Most existing algorithms rely on the oracle relational conditional independence to discover causal relationships, failing to learn from relational data; algorithms designed to learn causal dependencies from relational data typically adopt constraint-based approaches, but their performance is limited by finite sample sizes, resulting in relatively low recall and F1 score. To address these issues, a hybrid algorithm based on constraint and scoring (RCSH) was proposed. Undirected dependencies were first identified using a heuristic algorithm, and an undirected relational causal model was constructed. The Relational Bivariate Orientation (RBO) rule was then applied to orient the model. After the search space was restricted, a greedy hill-climbing algorithm was employed to improve sensitivity to long relational paths and multi-attribute dependencies under limited sample sizes. In the comparison experiments with Robust Relational Causal Discovery (RRCD), the proposed algorithm achieved improvements of approximately 12.8% in recall and 3.31% in F1-score, showing a steady upward trend as the dataset size increased. Furthermore, the applicability and effectiveness of RCSH were validated on real-world datasets.

Key words: Keywords: relational causal model, structure learning, causal discovery, relational data, hybrid algorithm

中图分类号:

中图分类号:TP311

闫琳钱宇华刘赛雄李珏. 基于关系型数据的混合因果模型学习算法[J]. 计算机应用, DOI: 10.11772/j.issn.1001-9081.2025111450.

[1]	蔡启健, 谭伟. 语义图增强的多模态推荐算法[J]. 《计算机应用》唯一官方网站, 2025, 45(2): 421-427.
[2]	吴相岚, 肖洋, 刘梦莹, 刘明铭. 基于语义增强模式链接的Text-to-SQL模型[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2689-2695.
[3]	向君幸, 吴永红. 基于邻域重心反向学习的混合樽海鞘群蝴蝶优化算法[J]. 《计算机应用》唯一官方网站, 2023, 43(3): 820-826.
[4]	任奇泽, 贾洪杰, 陈东宇. 融合局部结构学习的大规模子空间聚类算法[J]. 《计算机应用》唯一官方网站, 2023, 43(12): 3747-3754.
[5]	李蒙蒙, 秦伟, 刘艺, 刁兴春. 结合头脑风暴优化的混合蚁群优化算法[J]. 计算机应用, 2021, 41(8): 2412-2417.
[6]	李昡熠, 周鋆. 基于频繁项挖掘的贝叶斯网络结构学习算法BNSL-FIM[J]. 《计算机应用》唯一官方网站, 2021, 41(12): 3475-3479.
[7]	蔡瑞初, 白一鸣, 乔杰, 郝志峰. 基于混淆因子隐压缩表示模型的因果推断方法[J]. 计算机应用, 2021, 41(10): 2793-2798.
[8]	卢玲, 杨武, 刘旭, 李言. 基于实体情感演化置信网的观点检测方法[J]. 计算机应用, 2017, 37(5): 1402-1406.
[9]	柏亮王雷. 热轧圆钢生产订单接受问题优化模型与算法[J]. 计算机应用, 2014, 34(8): 2419-2423.
[10]	马进谢江戴东波谭军张武. 用于生物分子网络比对的自适应匈牙利贪心混合算法的并行化[J]. 计算机应用, 2013, 33(12): 3321-3325.
[11]	赵学武刘广亮程新党冀俊忠. 基于拓扑序列和量子遗传算法的贝叶斯网结构学习[J]. 计算机应用, 2013, 33(06): 1595-1603.
[12]	刘波王乘蒙培生. 混合滤波指纹增强[J]. 计算机应用, 2008, 28(7): 1892-1895.
[13]	王东吴湘滨. 提高链式Lin-kernighan算法性能的策略[J]. 计算机应用, 2007, 27(11): 2826-2829.
[14]	徐海霞;田铮;孟帆. 基于多尺度随机模型的SAR图像无监督分割[J]. 计算机应用, 2005, 25(10): 2367-2369.
[15]	聂文广，刘惟一，杨运涛，杨明. 基于信息论的Bayesian网络结构学习算法研究[J]. 计算机应用, 2005, 25(01): 1-3.

基于关系型数据的混合因果模型学习算法

Hybrid Causal Model Learning Algorithm Based on Relational Data

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics