news 2026/5/24 11:34:19

倾向性得分加权【9天实用统计学公益训练营Day4-3】

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
倾向性得分加权【9天实用统计学公益训练营Day4-3】

关注公众号的朋友都知道,郑老师我之前连续4年开设了“30天学会医学统计学”,从理论到实操,一步一步教会大家统计学、SPSS课程。

2026年,我们对这门课程进行全新升级!课程时间大幅度缩短,内容大幅度提升!

我称为:9天实用医学统计学公益训练营。

课程介绍:“9天实用医学统计学”公益训练营即将启动,更高效、更高级的统计课

本课程是浙江中医药大学医学统计学教研室的公益、免费公开视频课!不是骗人入坑收费的广告。本课程公益视频课定期开课,欢迎您参与学习。

欢迎报名

本公众号“医学论文与统计分析”,后台回复“报名”,加入微信学习群吧。

Day 4-3 倾向性得分加权

今天我们继续学习倾向性得分加权分析方法。

这个方法非常重要,在本小节中,我删去了一些非常前沿的概念,因为对初学者来讲这理解起来有点难度。但是剩下的内容非常重要,希望大家能认真学习。

“反事实框架与反事实结果

我们讲倾向性得分加权,先讲第一个概念:反事实。

√什么是“反事实”框架?什么是“反事实”结果?

100多年前,科学哲学家大卫·刘易斯提出了“反事实”框架,作为因果推论的标准。

举个例子:假如有一个人在某种服药状态(暴露A)下,可以观察到某种结果B,这是事实结果。

那么反事实就是:这个人此时如果不服药,会得到另外一个结果B',这个结果叫反事实结果。

反事实结果是观察不到的——因为违反事实,它是灰色的。

再比如,研究一种新降压药A,想知道它能不能降血压。每个人面对这个药物时,都有两个潜在结果:

  • 一个是服用药物A的结果,一个是不服用药物A的结果。

对于每个服药的人来说,我们只能观察到一个结果:他要么服药,要么不服药。如果他服药,你就观察不到他不服药的结果。

每个人在现实世界中只有一种状态——事实状态,没有反事实状态。

√为什么反事实很重要?

假如同一个个体,我们既能观察到他的事实结果(服药),又能观察到他的反事实结果(不服药),然后算个差值,这个差值不就是药物带来的净效果吗?

服药和不服药,针对同一个人完全可比,这个差值就是我们想要的处理效应。

但实际上这是不存在的。打个比方说,有一个平行世界,两个你——这个地球上你服药,另一个地方你不服药,算个差值。这就是我们想要的,但不存在。

√如何近似实现反事实?

可以说,随机对照研究(RCT)是最接近反事实框架的研究。

  • 它通过随机分组,一组干预组、一组对照组,两组人群非常相似。相似的两组人群,不就接近事实与反事实吗?

  • 同时开始处理,一组服药、一组不服药,他们之间的差异就是事实与反事实状态下的差异。

因此,随机对照研究是最接近科学要求的因果推断,是产生正确结果的金标准方法。

观察性研究中,倾向性得分方法也可以塑造出反事实人群,因此它也属于反事实框架的研究。

上一节我们讲的匹配,就是产生两组相似的个体,那不就是事实与反事实吗?但匹配有缺点——它扔掉了一大批研究对象。

因此,我们现在提出倾向性得分加权的方法,包括逆概率加权和标准化死亡比加权。

因果推断的三个重要效应指标

在学习这两种加权方法之前,我们先引入几个新的概念。

还是用之前的例子:治疗非小细胞肺癌药物的前瞻性队列研究,暴露组是放疗加纳武利尤单抗,对照组是传统放疗,两组是不可比的。

  • 假设1000例患者是我们随机抽样得到的代表性样本,代表着真实世界的所有肺癌患者。

其中600例代表愿意接受联合治疗的患者,400例代表倾向于传统放疗的患者。

基于反事实框架,思考以下两个问题:

1.所有1000个人都接受了联合治疗,效果怎么样?

2.本来就倾向于接受联合治疗的患者,最后接受了联合治疗,效果怎么样?

你肯定能理解,这两个结果是不一样的,因为研究对象有区别:1000个人和600个人是有差异的。

这里就涉及到评价效果的几个重要概念:

简单来说。

  • ATE是1000例都接受联合治疗 vs 1000例都不接受联合治疗(所有人都吃药 vs 所有人都不吃药);

  • ATT是那些本来就想接受联合治疗的人,最后接受了联合治疗的效果(代表暴露组对象);

  • ATC是那些本来接受传统放疗的群体,最后接受了联合治疗的效果。

这三个群体是不同的,效应也是不一样的。倾向得分加权时,不同的加权方法算出的效应是不一样的。

这三个概念是因果推断非常基础的评价效应概念,尤其是ATE,是因果推断的重要专用名词。

如果不开展倾向得分加权、不构造反事实人群,ATE、ATT、ATC都很难直接获得:

  • 算ATE时,如果直接比较暴露组与对照组,两组不均衡、不可比,没法评价;

  • 算ATT时,事实人群只有暴露组,没有反事实人群(对照组),没法评价;

  • 算ATC时,只有对照组,没有接受暴露的反事实人群,没法评价。

因此,我们必须构造反事实的群体来计算ATE、ATT、ATC。

逆概率加权与标准化死亡比加权

倾向得分加权通过加权的方法获得事实人群和反事实人群。加权时,首先要设置一个参考群体,这个参考群体叫标准化群体。我们通过权重对齐,使得暴露组和对照组的人群特征与参考群体一致,这样两组就可比了。

  • 逆概率加权是最常见的,它是以所有观察对象作为标准人口进行对齐。

  • 标准化死亡比加权用得不多,它以暴露组对象的特征作为标准人口进行对齐,对照组要乘一个系数,使得加权后对照组与暴露组的特征相似。

标准化方法举例:甲疗法 vs 乙疗法

某医院用甲疗法和乙疗法分别治疗400例胃溃疡患者,有普通型和危重型两种。

可以看到:甲疗法75%是普通型,乙疗法75%是危重型。

无论普通型还是危重型,都是乙疗法治愈率更高,但汇总后却显示甲疗法治愈率更高——这就是混杂偏倚,病情的分布结构不一样导致的。

√标准化的思想

我们希望用标准化方法对齐甲疗法和乙疗法的人群特征,然后再比较两种疗法。标准化方法就是在共同的标准上计算标准化率,比较两组或多组。

  • 共同标准可以是:大样本群体(如全省、全国、世界人口构成),用于比较不同国家或省份;

  • 也可以将比较的一组作为标准(标准化死亡比加权);

  • 也可以将比较的组别合并作为标准(逆概率加权)。

标准化使用的标准不同,标准化率也不同,因此算出来的效应也不一样。但无论哪种标准,结果的方向不会改变——甲疗法差,永远是甲疗法差。

√具体计算

将比较的组别合并作为共同标准:甲疗法+乙疗法共800人,普通型和危重型各400人。

按照甲疗法的治愈率、乙疗法的治愈率计算:

  • 甲疗法的预期治愈数:380

  • 乙疗法的预期治愈数:427

  • 甲疗法标准化率:47.5%

  • 乙疗法标准化率:53.4%

乙疗法比甲疗法更高,纠正了原先的错误结论。

从实际人数到标化人口:甲疗法危重型乘以1.33的系数,乙疗法普通型乘以4、危重型乘以1.33。

这一顿操作后,甲疗法和乙疗法的分析对象都变成了800例,就可比了。

√倾向得分加权的算法逻辑

倾向得分加权通过加权的方法获得事实人群和反事实人群。这种加权的方式,首先要设置一个参考群体,这个参考群体叫标准化群体。

  • 我们实际的引用对象,通过权重对齐——通过加权,使得暴露组和对照组的人群特征都与参考群体一致,那就可比了。

逆概率加权,缩写是IPTW,这是最常见的--它是以所有观察对象作为标准人口进行对齐。这个标准人口就是所有观察对象——刚才讲的1000例,就是我们的所有观察对象。

标准化死亡比加权法,简写是SMRW,这种方法用得不多--它以暴露组对象(600例)的特征作为标准人口进行对齐,对照组要乘一个系数。加权完了之后,对照组与暴露组的对象特征相似——也就是以暴露组作为标准人口进行对齐。

  • 也有文献把第一种称为逆概率加权ATE,第二种称为逆概率加权ATT

两种方法的核心区别在于:

  • 逆概率加权(IPTW):以总人口作为标准人口,算出的效应是ATE;

  • 标准化死亡比加权(SMRW):以暴露组作为标准人口,算出的效应是ATT。

我们来看下面这个示意图。总人口的特征,和我们刚才讲的暴露组、对照组特征都相似了,这个叫IPTW,逆概率加权,算出来是ATE。

再看这个图:有一个暴露组的群体,黄色的。我们按照暴露组群体进行加权,最后对照组跟暴露组的特征都相似了,这个叫标准化死亡比加权,它算出来是ATT。

√逆概率加权的具体算法

我们再稍微拓展,讲一下逆概率加权的算法。

IPTW是利用倾向性评分倒数来处理数据间混杂的方法。它有两种加权方法:Robins法和海曼法。

Robins法(普通型)是早期的一种策略。它的权重算法是:

  • 暴露组权重 = 1/PS

  • 对照组权重 = 1/(1-PS)

它的缺点是加权后样本量与原样本量不一致,可能远远大于原样本量。样本量不一致,抽样误差就改变了,数据分析可能就有问题。样本量增加了,容易导致假阳性结果出现——看起来挺好,但是不靠谱。

海曼法(稳健型)又称稳健法。为什么叫稳健法?因为加权后的总样本量和原样本量基本一致。在算法上,它有一个PT,这个PT就是暴露组所占的比例。权重算法是:

  • 暴露组权重 = PT/PS

  • 对照组权重 = (1-PT)/(1-PS)

算法上非常简单,我们手工就可以快速算出来。

推荐使用海曼法(稳健型IPTW)。因为用稳健型的IPTW可以降低假阳性率的发生。现在我们都推荐稳健型的IPTW,我们在看英文文献的时候可以看到这个方法的描述。

郑老师有些时候看文章,会看它的样本量,从样本量就可以看出它是稳健型的还是普通型的。

加权后的数据分析

加权后,一般基于加权的分析工具进行分析。R语言比较流行,有一个survey包,可以进行加权分析,例如加权t检验、加权卡方检验、加权回归。

如果这个时候还存在自变量分组不均衡,那么我们可以纳入这些自变量和暴露因素,开展多因素的加权回归,例如:

  • 多因素的加权Logistic回归

  • 多因素的加权Cox模型

进一步控制混杂偏倚。

小结

以上就是倾向性得分加权的理论内容。后面我们再讲实践。

如果你对整个倾向性得分章节有问题,可以在公众号“医学论文统计分析”后台回复4001,我们会不断把大家的问题纳入答疑帖,方便大家理解。

最后提醒:要学习本推文的完全对应的课程视频,请发送关键词“报名”至公众号,加入高校公益免费课程群来学习吧

关于郑老师团队及公众号

全国较大的医学统计服务平台,专注于医学生、医护工作者学术研究统计支持

郑老师团队可以提供诸多统计支持:

各式统计课程、临床试验设计

构建预测模型与真实世界研究

“双库”保发表训练营、医学数据库挖掘

详情联系助教小董咨询(微信号aq566665

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/24 11:33:18

固态电池的“热矛盾”:如何同时驯服快充热冲击与低温寒潮?

🎓作者简介:科技自媒体优质创作者 🌐个人主页:莱歌数字-CSDN博客 211、985硕士,从业16年 从事结构设计、热设计、售前、产品设计、项目管理等工作,涉足消费电子、新能源、医疗设备、制药信息化、核工业等…

作者头像 李华
网站建设 2026/5/24 11:32:52

量子退火加速神经网络训练的原理与实践

1. 量子退火加速神经网络训练的核心原理量子退火技术为神经网络训练提供了一种全新的加速路径。从物理本质上来看,神经网络训练过程可以被理解为一个复杂的相变过程:系统从初始的随机自旋玻璃态(spin glass state)逐渐演化到高度有…

作者头像 李华
网站建设 2026/5/24 11:23:11

Video2X终极指南:让模糊视频秒变高清的完整教程

Video2X终极指南:让模糊视频秒变高清的完整教程 【免费下载链接】video2x A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018. 项目地址: https://gitcode.com/GitHub_Trending/vi/video2x …

作者头像 李华
网站建设 2026/5/24 11:20:59

140、运动控制中的电磁兼容(EMC)设计

运动控制中的电磁兼容(EMC)设计 一次让我通宵的伺服抖动 去年夏天,一个六轴机械臂项目在客户现场频繁出现“鬼畜”抖动。电机在低速运行时,编码器反馈偶尔会跳变几个脉冲,导致位置环输出剧烈震荡。我们用示波器抓了三天,最后发现罪魁祸首是——驱动器到电机的动力线缆和…

作者头像 李华
网站建设 2026/5/24 11:19:58

符号回归发现波浪破碎新边界方程:水面与流速解耦机制解析

1. 项目概述:当符号回归遇见波浪破碎作为一名长期在计算流体力学和海洋工程领域摸爬滚打的从业者,我深知“波浪破碎”这个现象有多让人又爱又恨。爱的是,它无处不在,从冲浪板下的浪花到巨轮船艏劈开的白色航迹,充满了力…

作者头像 李华