欢迎访问广东工业大学数据挖掘与信息检索实验室!
ICML 2024 oral | 双重鲁棒性质的网络效应估计方法构建
2024-12-31 16:51 陈伟霖 

导语:

    近日,广东工业大学计算机学院数据挖掘与信息检索(DMIR)实验室的论文 Doubly Robust Causal Effect Estimation under Networked Interference via Targeted Learning 被人工智能、机器学习领域的顶级国际会议ICML 2024 (International Conference on Machine Learning) 接收并被选为oral论文在大会报告。ICML是国际机器学习学会主办的国际会议,也是CCF A 类会议。下面带来该论文的详细解读。

18E96

1 研究背景

   在传统的因果推断中,大部分观察性研究都假设个体之间独立同分布。在许多场景下,个体之间通过社交网络等方式互相连接,治疗效果也会通过个体之间进行传递。因此,在广告营销、流行病学等领域,人们对基于网络数据的因果效应估计方法越来越感兴趣。如图1的疫苗接种例子所示,个体接种疫苗(treatment)不仅能够降低个体本身感染率(outcome),也会间接影响邻居个体的接种情况、感染率。传统方法基于单一模型构建估计器,容易陷入模型误指(model misspecification)等问题,从而导致网络效应估计不准确。因此,一个重要的挑战是,如何有效构建多估计器结合的具有双重鲁棒性质的网络效应估计方法。

80A6

图 1 用户行为序列和动态异构图

   针对上述挑战,我们首先推广了目标学习(Targeted Learning),将其拓展到了网络场景下,为双重鲁棒估计器设计提供理论基础。在此基础上,我们设计了TNet,包含信息聚合模块、广义倾向性得分估计模型、结果回归模块与扰动模块,其中扰动模块的设计理论支撑来自于目标学习,通过扰动模块实现广义倾向性得分估计模型、结果回归模块的有效结合,从而使得TNet具有双重鲁棒性。对于TNet,我们提供了其收敛分析,证明了其相较于单一模型具有更快的收敛速率。通过大量的实验研究表明,我们的 TNet方法优于最先进的效应估计方法。

2 TNet方法构建

   本研究从传统的目标学习(Targeted Learning)出发,首先推导满足双重鲁棒性质的模型的条件。具体而言,网络效应下的影响函数为:

2C72

其中 and

   当估计器 使得上述影响函数为零时,其估计器具有双重鲁棒性质,即满足

   因此,基于上述性质,我们设计了如下的网络模型(图2):

31A9D

图 2 TNet模型框架

   具体地,我们的模型包含了信息聚合模块、广义倾向性得分估计模块、结果回归模块与扰动模块。信息聚合模块是用GNN聚合个体与邻居协变量信息;广义倾向性得分估计模块用于估计 ,结果回归模块用于估计 ;扰动模块使得TNet满足 。基于上述构建方法,我们的模型相较于单一模型,具有更快的收敛速率:

35AE

3 实验结果

   本研究在两份半生成数据(BC,Flickr数据集)的实验中证明了模型的有效性。其中,模型TNet(w/o/ ) 为去除扰动模块的消融实验模型,其与TNet结果对比表表明扰动模块的作用,进一步证明了文章理论的正确性。

34A32

图 3 TNet与基线方法在BC数据集上的实验结果

33246

图 4 TNet与基线方法在Flickr数据集上的实验结果

169D8

图 5 TNet对超参的敏感性分析结果


关闭窗口