欢迎访问广东工业大学数据挖掘与信息检索实验室!
CaMal系列讲座 | 北京大学研究员苗旺应邀为DMIR实验室作学术讲座
2023-08-01 16:08  

7月29日下午,北京大学概率统计系研究员苗旺应DMIR实验室蔡瑞初教授的邀请,通过线上形式为实验室师生作题为“Introducing a generalized tetrad constraint”的学术讲座。

43DDD

图1 | 苗旺老师作分享报告

本次报告包括两方面内容,一是广义四分体约束(generalized tetrad constraint),一是特异性得分(specificity score)。

关于广义四分体约束,苗旺老师首先简要介绍经典的四分体约束(tetrad constraint)并指出其在非线性、非参数的场景中可能失效,进而基于confounding bridge functions提出广义四分体约束。接着,苗旺老师介绍用于测量条件均值的检验统计量MDD(martingale difference divergence),并给出广义四分体约束的检验框架。最后,苗旺老师展示了所提出的方法在模拟数据和“Holzinger and Swineford”数据集上的结果。

FCE8

图2 | 广义四分体约束

DEAB

图3 | 检验统计量MDD

关于特异性得分部分,苗旺老师首先介绍了混杂偏倚的调整方法,包括使用工具变量(instrumental variable)和阴性对照(negative controls)。接着,苗旺老师阐明了因果特异性(causal specificity)假设的定义及其与Bradford Hill特异性之间的差异,并在线性模型和因果特异性假设下给出原假设H0的可验证含义。最后,苗旺老师介绍了特异性得分估计、特异性检验过程和特异性图谱,并考虑了非参数模型和多混杂因素下的可识别性问题。

整个报告内容充实,学术气氛浓郁。实验室的师生们与苗旺老师展开了深入的互动和探讨,感到受益匪浅。

1CECC

图4 | 实验室师生踊跃参与讨论

CaMal (Causal Modeling and Machine Learning) 是DMIR实验室发起的国际因果关系与机器学习研讨会以及系列学术活动的简称。CaMal系列活动秉持学术至上、形式自由的原则,邀请国内外相关领域的一线学者展开交流合作,致力于推动因果关系、机器学习及相关领域的研究与探讨。
关闭窗口