分布式统计推断:方法、理论与应用
- A+
:陈勇(美国宾夕法尼亚大学)
:2025-06-20 10:00
:海韵园实验楼S106
报告人:陈勇(美国宾夕法尼亚大学)
时 间:2025年6月20日10:00
地 点:海韵园实验楼S106
内容摘要:
电子健康记录(EHR)与真实世界数据的迅速增长,为统计推断提供了前所未有的丰富数据资源。然而,这些数据的异质性、高维性、以及因隐私法规所限制的信息共享,给传统的统计方法带来了新的挑战。在此背景下,我们提出了一套系统化的隐私保护型分布式统计推断框架,以支持在多机构环境中进行可靠、高效的统计分析,而无需共享个体级数据。本报告将系统介绍我们团队近年来在分布式估计与推断理论方面的研究进展,涵盖线性与广义线性模型、高维变量选择、因果推断、非参数方法、聚类分析、反事实估计等多个统计任务。我们将重点介绍所提出算法的通信效率、收敛性理论、渐近性质以及在异质数据环境下的鲁棒性分析。此外,我们的工作在多个国际多中心项目中得到了验证,如PCORnet、OHDSI与RECOVER项目,凸显了统计方法在医学与公共健康研究中所发挥的核心作用。通过这一系列方法,我们展示了如何在受限的信息共享环境中实现严谨的统计推断,从而为构建新一代数据驱动的统计科学提供理论基础与实践路径。
个人简介:
陈勇,美国宾夕法尼亚大学生物统计学教授,健康人工智能与循证综合研究中心(CHASE)的创始主任,领导利用真实世界数据开展临床证据生成与综合的研究工作。他同时担任宾大计算、推断与学习实验室(PennCIL)主任,致力于开发整合临床数据的方法学研究。
陈教授现任《美国统计协会期刊》(JASA)与《应用统计年刊》(AoAS)副主编,是《新英格兰医学杂志-AI》统计顾问,并担任《柳叶刀》罕见病委员会委员。
陈教授已在统计学与医学信息学领域发表超过200篇同行评审论文,并持续获得NIH、AHRQ与PCORI等机构资助。他的研究重点包括证据综合、数据整合与精准医学应用。他是美国统计学会会士与美国医学信息学学院会士,兼任应用数学系与生物医学信息研究所的联合教授。
联系人:梁薇