介绍及讲解:杜斌
|
[最近在上网时发现,有些医生对统计学的部分概念并不清楚。相信这是当前国内医学教育的典型弊病之一。课堂上虽然学习了统计学,考试也及了格,但其实并不会使用。这种现象颇值得统计学老师反思。] |
|
(CSCCM原创,转载请注明) |
|
|
|
|
首先通过一个例子说明混杂因素的影响: |
|
|
|
|
Q:灰头发是否死亡的危险因素? |
|
|
共200例患者中,死亡75例,灰发100例。四格表如下: |
|
|
表1 患者头发颜色与预后的关系 |
|
|
|
|
死亡
|
存活
|
|
|
灰发 +
|
45
|
55
|
100
|
灰发 -
|
30
|
70
|
100
|
|
75
|
125
|
200
|
|
|
|
|
|
|
|
据上表计算: |
|
|
灰发患者死亡的危险为45% |
|
|
非灰发患者死亡的危险为30% |
|
|
因此,灰发患者死亡的相对危险度(RR)为1.5 |
|
|
|
|
Q:上述结论是否正确?究竟存在什么问题? |
|
|
其实,进一步分析可能发现(表2和表3),与青年患者相比,老年患者灰发比例更高(80% vs. 20%),同时死亡率也更高(50% vs. 25%) |
|
|
表2 老年患者头发颜色与预后的关系 |
|
|
|
|
死亡
|
存活
|
|
|
灰发 +
|
40
|
40
|
80
|
灰发 -
|
10
|
10
|
20
|
|
50
|
50
|
100
|
|
|
|
|
|
|
|
表3 青年患者头发颜色与预后的关系 |
|
|
|
|
死亡
|
存活
|
|
|
灰发 +
|
5
|
15
|
20
|
灰发 -
|
20
|
60
|
80
|
|
25
|
75
|
100
|
|
|
|
|
|
|
|
对于老年患者而言(表2),灰发并非死亡的危险因素(RR = 50%/50% = 1) |
|
|
对于青年患者而言(表3),灰发也不是死亡的危险因素(RR = 25%/25% = 1) |
|
|
|
|
|
因此, |
|
|
经过校正后的相对危险度(RR) = 1.0(未经校正的RR = 1.5) |
|
|
灰发对死亡率的影响能够完全用年龄因素的影响解释 |
|
|
所以, |
|
|
年龄是本例中的混杂因素(confounder) |
|
|
|
|
|
如果存在混杂因素,就意味着: |
|
|
一种因素的作用受到了另一种因素作用的影响 |
|
|
从而影响了对该因素作用的解释 |
|
|
|
|
由上可见,混杂因素的特点为 |
|
|
> 是研究结局的独立危险因素(年龄是死亡率的独立危险因素) |
|
|
> 与研究因素相关,且在研究因素阳性(暴露)组和阴性(非暴露)组中分布不均一(灰发组年龄大者多,非灰发组年龄小者多) |
|
|
> 并非研究因素与研究结局因果关系中的中间环节 |
|
|
|
>> 年龄并非灰发与死亡相关关系之间的中间环节,因此年龄可以成为混杂因素 |
|
|
|
>> 高脂食品 --> 高脂血症 --> 冠心病,因此高脂血症并非混杂因素 |
|
|
|
|
|
例如:ICU患者病死率低是否意味治疗水平高? |
|
|
ICU收治患者病情轻 --> 病死率低 --> 与治疗水平无关 |
|
|
病情轻重即为混杂因素,需要对此进行校正 |
|
|
|
|
Q:如何识别混杂因素? |
|
|
灰发与死亡存在相关关系。年龄是否为混杂因素? |
|
|
年龄与死亡存在相关关系。灰发是否为混杂因素? |
|
|
|
|
|
需要注意的是:数据本身不能告诉我们哪一个为混杂因素! |
|
|
判断某个因素是否为混杂因素的简单方法:比较校正前后的OR值 |
|
|
|
|
|
例如:分析中度饮酒与冠心病的相关关系 |
|
|
表4 中度饮酒与冠心病的关系 |
|
|
|
|
冠心病
|
对照
|
|
|
中度饮酒
|
71
|
52
|
123
|
不饮酒
|
29
|
48
|
77
|
|
100
|
100
|
200
|
|
|
|
|
|
|
|
计算OR = 71 x 48 / (52 x 29) = 2.26 |
|
|
提示中度饮酒为罹患冠心病的危险因素 |
|
|
|
|
|
但是,我们知道,饮酒与吸烟密切相关。因此,当根据吸烟情况进行校正后, |
|
|
表5 根据吸烟校正后中度饮酒与冠心病的关系 |
|
|
|
|
吸烟
|
不吸烟
|
|
|
|
冠心病
|
对照
|
冠心病
|
对照
|
|
|
中度饮酒
|
|
36
|
|
16
|
123
|
不饮酒
|
|
4
|
|
44
|
77
|
|
OR
|
1.0
|
1.0
|
|
|
|
|
|
|
|
|
校正后的OR = 1.0,说明吸烟可能为混杂因素 |
|
|
但是,吸烟究竟是否真正的危险因素呢? |
|
|
|
|
|
需要:根据自己的认识和知识确定: |
|
|
|
某些因素为独立的危险因素 |
|
|
|
某些因素与可能的危险因素之间存在相关性 |
|
|
|
某些因素与病因无关 |
|
|
|
|
Q:如何对待混杂因素 — 试验设计 |
|
|
> 随机分组(即把已知和未知的混杂因素均一分布在治疗组与对照组中) |
|
|
> 限制(即把试验局限于某些特殊人群,如老年患者) |
|
|
> 匹配(即对于每位老年灰发患者,选择一名老年非灰发患者进行配对) |
|
|
|
|
Q:如何对待混杂因素 — 结果分析 |
|
|
> 数据分层(对于所有混杂因素进行单独分析) |
|
|
> 多因素分析(通常包括线性回归,逻辑回归,Cox回归) |
|
|
|
|
|
需要注意的是,除随机分组外,其他方法仅对已知的混杂因素有效 |
|
|
如果我们不知道哪些因素是可能的混杂因素,就无法在结果分析时对其进行校正 |
|
|
|
|
|
例如:BMI对发生ESRD危险性的影响,应当对哪些混杂因素进行校正? |
|
|
年龄,性别,动脉收缩压,蛋白尿 |
|
|
表6 发生ESRD的危险因素 — 单因素分析结果 |
|
|
|
|
OR (95%CI)
|
P值
|
|
年龄
|
1.013 (1.007 – 1.020)
|
< 0.0001
|
男性
|
1.013 (1.007 – 1.020)
|
< 0.0001
|
SBP, mmHg
|
1.029 (1.025 – 1.033)
|
< 0.0001
|
BMI
|
1.293 (1.181 – 1.415)
|
< 0.0001
|
蛋白尿
|
3.073 (3.868 – 3.294)
|
< 0.0001
|
|
|
|
|
|
|
|
单因素分析结果表明, |
|
|
年龄,性别,动脉收缩压,BMI和蛋白尿均是罹患ESRD的危险因素 |
|
|
|
|
|
但是,如果进行多因素分析 |
|
|
表7 发生ESRD的危险因素 — 多因素分析结果 |
|
|
|
|
OR (95%CI)
|
P值
|
|
年龄
|
1.000 (0.993 – 1.007)
|
NS
|
男性
|
1.510 (1.225 – 1.861)
|
0.0001
|
SBP, mmHg
|
1.018 (1.013 – 1.023)
|
< 0.0001
|
BMI
|
1.111 (1.012 – 1.220)
|
0.0274
|
蛋白尿
|
2.835 (2.637 – 3.048)
|
< 0.0001
|
|
|
|
|
|
|
OR (95%CI)
|
P值
|
|
年龄
|
1.000 (0.993 – 1.007)
|
NS
|
男性
|
1.510 (1.225 – 1.861)
|
0.0001
|
SBP, mmHg
|
1.018 (1.013 – 1.023)
|
< 0.0001
|
BMI
|
1.111 (1.012 – 1.220)
|
0.0274
|
蛋白尿
|
2.835 (2.637 – 3.048)
|
< 0.0001
|
|
|
|
|
|
|
|
多因素分析结果表明, |
|
|
性别,动脉收缩压,BMI和蛋白尿是罹患ESRD的“独立”危险因素 |
|
|
但是,年龄不再成为独立的危险因素,说明年龄受到某个(或某些)混杂因素的影响(虽然我们并不确切知道是哪个或哪几个因素,但应当是表格中列举的危险因素之一) |
|
|
|
|
|
另一个例子: |
|
|
研究血液系统恶性肿瘤是否对急性肾功能衰竭患者的ICU病死率产生影响 |
|
|
表8 急性肾功能衰竭患者死亡的危险因素 — 单因素分析结果 |
|
|
|
|
HR (95%CI)
|
P值
|
|
基础情况
|
|
|
血液系统恶性肿瘤
|
1.52 (1.07 – 2.13)
|
0.018
|
年龄> 65岁
|
1.20 (0.09 – 1.59)
|
0.21
|
入ICU前住院日(每增加一天)
|
1.01 (1.01 – 1.02)
|
< 0.001
|
入住ICU期间病情严重程度
|
|
|
APACHE II(每增加一分)
|
1.05 (1.03 – 1.06)
|
< 0.001
|
机械通气
|
1.92 (1.35 – 2.73)
|
< 0.001
|
使用升压药物
|
2.51 (1.65 – 3.82)
|
< 0.001
|
应用CRRT
|
2.34 (1.75 – 3.14)
|
< 0.001
|
|
|
|
|
|
|
|
表9 急性肾功能衰竭患者死亡的危险因素 — Cox比例风险模型分析结果 |
|
|
|
|
HR (95%CI)
|
P值
|
|
基础情况
|
|
|
血液系统恶性肿瘤
|
|
0.78
|
年龄> 65岁
|
|
0.093
|
入ICU前住院日(每增加一天)
|
1.02 (1.01 – 1.03)
|
< 0.001
|
入住ICU期间病情严重程度
|
|
|
APACHE II(每增加一分)
|
1.04 (1.02 – 1.05)
|
< 0.001
|
机械通气
|
|
0.35
|
使用升压药物
|
2.1 (1.38 – 3.28)
|
0.001
|
应用CRRT
|
|
|
|
|
|
|
|
|
|
结果显示: |
|
|
未经过校正时,血液系统恶性肿瘤的HR = 1.52, p = 0.018(是死亡的危险因素) |
|
|
对APACHE II评分进行校正后,HR = 1.28 (0.91 – 1.85), p = 0.16 |
|
|
对入ICU前住院日进行校正后,HR = 1.33 (0.93 – 1,89), p = 0.12 |
|
|
对所有因素进行校正后,p = 0.78 |
|
|
|
|
|
研究者在讨论中提到: |
|
|
“在对这些混杂因素进行校正后,我们发现,血液系统恶性肿瘤不再是6个月病死率的危险因素” |
|
(CSCCM原创,转载请注明)
|