现在的位置: 首页临床统计, 临床话题>正文
[临床统计] 有关混杂因素的补充说明
2012年08月19日 临床统计, 临床话题 评论数 320
有关混杂因素的补充说明     Supplementary explanation concerning the confounders
介绍及讲解:杜斌
    [最近在上网时发现,有些医生对统计学的部分概念并不清楚。相信这是当前国内医学教育的典型弊病之一。课堂上虽然学习了统计学,考试也及了格,但其实并不会使用。这种现象颇值得统计学老师反思。]
(CSCCM原创,转载请注明)
首先通过一个例子说明混杂因素的影响:
Q:灰头发是否死亡的危险因素?
共200例患者中,死亡75例,灰发100例。四格表如下:
表1       患者头发颜色与预后的关系

死亡
存活

灰发 +
45
55
100
灰发 -
30
70
100
75
125
200

据上表计算:
灰发患者死亡的危险为45%
非灰发患者死亡的危险为30%
因此,灰发患者死亡的相对危险度(RR)为1.5
Q:上述结论是否正确?究竟存在什么问题?
其实,进一步分析可能发现(表2和表3),与青年患者相比,老年患者灰发比例更高(80% vs. 20%),同时死亡率也更高(50% vs. 25%)
表2       老年患者头发颜色与预后的关系

死亡
存活

灰发 +
40
40
80
灰发 -
10
10
20
50
50
100

表3       青年患者头发颜色与预后的关系

死亡
存活

灰发 +
5
15
20
灰发 -
20
60
80
25
75
100

对于老年患者而言(表2),灰发并非死亡的危险因素(RR = 50%/50% = 1)
对于青年患者而言(表3),灰发也不是死亡的危险因素(RR = 25%/25% = 1)
因此,
经过校正后的相对危险度(RR) = 1.0(未经校正的RR = 1.5)
灰发对死亡率的影响能够完全用年龄因素的影响解释
所以,
年龄是本例中的混杂因素(confounder)
如果存在混杂因素,就意味着:
一种因素的作用受到了另一种因素作用的影响
从而影响了对该因素作用的解释
由上可见,混杂因素的特点为
> 是研究结局的独立危险因素(年龄是死亡率的独立危险因素)
> 与研究因素相关,且在研究因素阳性(暴露)组和阴性(非暴露)组中分布不均一(灰发组年龄大者多,非灰发组年龄小者多)
> 并非研究因素与研究结局因果关系中的中间环节
>> 年龄并非灰发与死亡相关关系之间的中间环节,因此年龄可以成为混杂因素
>> 高脂食品 --> 高脂血症 --> 冠心病,因此高脂血症并非混杂因素
例如:ICU患者病死率低是否意味治疗水平高?
ICU收治患者病情轻 --> 病死率低 --> 与治疗水平无关
病情轻重即为混杂因素,需要对此进行校正
Q:如何识别混杂因素?
灰发与死亡存在相关关系。年龄是否为混杂因素?
年龄与死亡存在相关关系。灰发是否为混杂因素?
需要注意的是:数据本身不能告诉我们哪一个为混杂因素!
判断某个因素是否为混杂因素的简单方法:比较校正前后的OR值
例如:分析中度饮酒与冠心病的相关关系
表4       中度饮酒与冠心病的关系

冠心病
对照

中度饮酒
71
52
123
不饮酒
29
48
77
100
100
200

计算OR = 71 x 48 / (52 x 29) = 2.26
提示中度饮酒为罹患冠心病的危险因素
但是,我们知道,饮酒与吸烟密切相关。因此,当根据吸烟情况进行校正后,
表5       根据吸烟校正后中度饮酒与冠心病的关系

吸烟
不吸烟

冠心病
对照
冠心病
对照

中度饮酒
63
36
8
16
123
不饮酒
7
4
22
44
77

OR
1.0
1.0

校正后的OR = 1.0,说明吸烟可能为混杂因素
但是,吸烟究竟是否真正的危险因素呢?
需要:根据自己的认识和知识确定:
某些因素为独立的危险因素
某些因素与可能的危险因素之间存在相关性
某些因素与病因无关
Q:如何对待混杂因素 — 试验设计
> 随机分组(即把已知和未知的混杂因素均一分布在治疗组与对照组中)
> 限制(即把试验局限于某些特殊人群,如老年患者)
> 匹配(即对于每位老年灰发患者,选择一名老年非灰发患者进行配对)
Q:如何对待混杂因素 — 结果分析
> 数据分层(对于所有混杂因素进行单独分析)
> 多因素分析(通常包括线性回归,逻辑回归,Cox回归)
需要注意的是,除随机分组外,其他方法仅对已知的混杂因素有效
如果我们不知道哪些因素是可能的混杂因素,就无法在结果分析时对其进行校正
例如:BMI对发生ESRD危险性的影响,应当对哪些混杂因素进行校正?
年龄,性别,动脉收缩压,蛋白尿
表6       发生ESRD的危险因素 — 单因素分析结果

OR (95%CI)
P值

  年龄
1.013 (1.007 – 1.020)
< 0.0001
  男性
1.013 (1.007 – 1.020)
< 0.0001
  SBP, mmHg
1.029 (1.025 – 1.033)
< 0.0001
  BMI
1.293 (1.181 – 1.415)
< 0.0001
  蛋白尿
3.073 (3.868 – 3.294)
< 0.0001

单因素分析结果表明,
年龄,性别,动脉收缩压,BMI和蛋白尿均是罹患ESRD的危险因素
但是,如果进行多因素分析
表7       发生ESRD的危险因素 — 多因素分析结果

OR (95%CI)
P值

  年龄
1.000 (0.993 – 1.007)
NS
  男性
1.510 (1.225 – 1.861)
0.0001
  SBP, mmHg
1.018 (1.013 – 1.023)
< 0.0001
  BMI
1.111 (1.012 – 1.220)
0.0274
  蛋白尿
2.835 (2.637 – 3.048)
< 0.0001


OR (95%CI)
P值

  年龄
1.000 (0.993 – 1.007)
NS
  男性
1.510 (1.225 – 1.861)
0.0001
  SBP, mmHg
1.018 (1.013 – 1.023)
< 0.0001
  BMI
1.111 (1.012 – 1.220)
0.0274
  蛋白尿
2.835 (2.637 – 3.048)
< 0.0001

多因素分析结果表明,
性别,动脉收缩压,BMI和蛋白尿是罹患ESRD的“独立”危险因素
但是,年龄不再成为独立的危险因素,说明年龄受到某个(或某些)混杂因素的影响(虽然我们并不确切知道是哪个或哪几个因素,但应当是表格中列举的危险因素之一)
另一个例子:
研究血液系统恶性肿瘤是否对急性肾功能衰竭患者的ICU病死率产生影响
表8       急性肾功能衰竭患者死亡的危险因素 — 单因素分析结果

HR (95%CI)
P值

  基础情况
  血液系统恶性肿瘤
1.52 (1.07 – 2.13)
0.018
  年龄> 65岁
1.20 (0.09 – 1.59)
0.21
  入ICU前住院日(每增加一天)
1.01 (1.01 – 1.02)
< 0.001
  入住ICU期间病情严重程度
   APACHE II(每增加一分)
1.05 (1.03 – 1.06)
< 0.001
   机械通气
1.92 (1.35 – 2.73)
< 0.001
   使用升压药物
2.51 (1.65 – 3.82)
< 0.001
   应用CRRT
2.34 (1.75 – 3.14)
< 0.001

表9       急性肾功能衰竭患者死亡的危险因素 — Cox比例风险模型分析结果

HR (95%CI)
P值

  基础情况
  血液系统恶性肿瘤
0.78
  年龄> 65岁
0.093
  入ICU前住院日(每增加一天)
1.02 (1.01 – 1.03)
< 0.001
  入住ICU期间病情严重程度
   APACHE II(每增加一分)
1.04 (1.02 – 1.05)
< 0.001
   机械通气
0.35
   使用升压药物
2.1 (1.38 – 3.28)
0.001
   应用CRRT

结果显示:
未经过校正时,血液系统恶性肿瘤的HR = 1.52, p = 0.018(是死亡的危险因素)
对APACHE II评分进行校正后,HR = 1.28 (0.91 – 1.85), p = 0.16
对入ICU前住院日进行校正后,HR = 1.33 (0.93 – 1,89), p = 0.12
对所有因素进行校正后,p = 0.78
研究者在讨论中提到:
“在对这些混杂因素进行校正后,我们发现,血液系统恶性肿瘤不再是6个月病死率的危险因素”
(CSCCM原创,转载请注明)

抱歉!评论已关闭.

×
腾讯微博