• • 下一篇
闫琳1,2,钱宇华3,刘赛雄4,李珏1
摘要: 摘 要: 真实世界中的关系涉及多种实体类型间的交互,关系因果模型(RCM)形象地刻画了这类关系。研究如何从关系因果模型中学习因果关系对复杂场景中的业务决策具有重要意义。现有算法大多依赖于先验知识(Oracle)的关系条件独立性检验来建立和确定因果关系,无法从关系型数据中学习因果;而已有的从关系型数据中学习因果的算法采用基于约束的方式,受到有限数据样本量的限制,导致其算法召回率和F1分数不是很高。基于上述问题,本文提出约束和打分相结合的混合算法(RCSH)。该算法首先通过启发式算法获取无向依赖,构建无向关系因果模型;然后利用关系双变量定向规则(RBO)对该关系因果模型进行定向,在限制搜索空间之后,引入贪婪爬山算法,缓解了已有算法在有限数据量样本下的对长关系路径和多属性依赖的低敏感性问题。合成数据集上的实验结果表明,与鲁棒关系因果发现算法(RRCD)相比,RCSH算法的召回率提升了约12.8%,F1分数提高了约3.31%,且随着数据规模的增大表现出稳步提升的趋势。同时,RCSH算法在真实数据集上也验证了其适用性与有效性。
中图分类号: