DMIR实验室

讲座预告 | CaMal系列讲座：基于工具变量的因果推断和因果可泛化学习

2023-04-23 11:14 DMIR实验室

CaMal系列学术讲座

报告主题：

基于工具变量的因果推断和因果可泛化学习

时间：

2023年04月26日（周三）下午14:00-18:00

地点：

线上：腾讯会议 887-881-172

线下：广东工业大学大学城校区工学一号馆727室

报告人：

况琨，副教授，浙江大学计算机学院

报告人简介：

况琨，浙江大学计算机学院副教授，博士生导师，人工智能系副主任。主要研究方向包括因果推理、数据挖掘、因果可信机器学习。在数据挖掘和机器学习领域已发表近70余篇顶级会议和期刊文章，包括KDD、ICML、NeurIPS、MM、AAAI、TKDE、TKDD、Engineering等。曾获2022年ACM SIGAI China 新星奖（Rising Star Award），2021年度中国科协青年人才托举工程项目支持，2022年度高等学校科学研究优秀成果奖（科学技术）科技进步一等奖，2021年度中国电子学会科技进步一等奖，2020年度中国人工智能学会优秀博士学位论文提名奖。

报告摘要：

现阶段机器学习尤其是深度学习的主要特点在于数据驱动、关联学习、和概率输出，导致模型普遍存在预测不稳定和不可解释等问题。我们认为这些问题的主要根源在于因果机制尚未融入机器学习。因此，我们需要从关联分析跨越到因果推理，将因果引入机器学习，从而实现模型的可解释性和稳定性。

大数据因果推断是实现从关联分析跨越到因果推理的核心一环。当因果推断遇上大数据，会面临高维连续变量，混淆变量观测不全等诸多挑战，导致传统因果推断方法在大数据环境下失效。如何利用机器学习和深度学习的技术，发挥数据优势、激发算法潜能，是实现大数据因果推断的核心。这次报告，我们主要从工具变量视角，给大家介绍如何利用机器学习赋能大数据因果推断。

另一方面，因果关系的可解释性和稳定性也给机器学习的可泛化性带来了可能。我们训练机器学习模型的数据往往是有偏的，如混淆偏差和选择偏差等，导致变量之间存在不稳定且不可解释的虚假关联。消除虚假关联，恢复因果关联是实现可解释可泛化机器学习的关键。这次报告，我们主要从因果推断中的工具变量视角出发，探讨领域泛化问题中存在的偏差问题，并提出因果可泛化学习机制。

CaMal (Causal Modeling and Machine Learning) 是DMIR实验室发起的国际因果关系与机器学习研讨会以及系列学术活动的简称。CaMal系列活动秉持学术至上、形式自由的原则，邀请国内外相关领域的一线学者展开交流合作，致力于推动因果关系、机器学习及相关领域的研究与探讨。

【关闭窗口】