题目
案例 13-1 为了研究糖尿病患者的C反应蛋白Y与年龄X1和体重指数X2的关系,某研究者调-|||-查了60名糖尿病患者,测量和收集了C反应蛋白 (mgL) 与年龄UND1和体重指数X2,结果见表-|||--1, 试分析C反应蛋白与年龄和体重指数的关系。-|||-表 13-1 C反应蛋白 Y(mg/L )与年龄X1(岁)和体重指数 _(2)(kg/(m)^2) 的资料-|||-no X1 x2 Y no X1 X2 Y no X1 X2 Y no X1 2 Y-|||-1 48 26.2 2.0 16 61 24.1 1.8 31 46 22.4 1.2 46 80 25.4 2.2-|||-2 81 26.3 2.0 17 60 23.7 2.7 32 53 22.4 1.6 47 82 29.7 3.5-|||-3 67 25.6 1.0 18 81 28.1 3.0 33 73 25.7 2.7 48 61 24.1 1.6-|||-4 51 26.2 2.4 19 75 27.7 2.7 34 74 27.3 3.2 49 51 23.5 1.3-|||-5 52 24.4 1.7 20 75 26.2 2.4 35 67 24.7 2.0 50 47 24.0 1.7-|||-6 78 26.1 1.0 21 66 26.6 2.5 36 81 25.7 2.5 51 75 28.1 2.5-|||-7 49 21.7 1.0 22 79 26.0 2.0 37 60 26.7 2.7 52 67 27.0 2.5-|||-8 54 23.8 1.2 23 65 25.4 2.0 38 46 21.9 1.2 53 81 27.3 2.0-|||-9 75 24.9 2.0 24 53 23.4 0.6 39 61 25.6 1.8 54 56 23.6 1.1-|||-10 74 26.2 1.6 25 66 25.3 1.2 40 69 27.5 2.4 55 53 25.9 1.1-|||-11 74 26.3 2.4 26 62 23.0 1.0 41 65 24.6 2.0 56 57 23.8 0.4-|||-12 63 25.2 1.1 27 55 26.8 1.7 42 63 27.0 2.5 57 80 29.4 2.5-|||-13 78 26.1 2.2 28 76 25.9 2.0 43 77 25.9 1.2 58 51 22.9 0.5-|||-14 60 27.0 2.2 29 46 22.4 1.7 44 48 25.4 2.0 59 74 27.0 1.3-|||-15 80 26.5 2.5 30 50 22.0 1.2 45 83 27.2 2.2 60 64 23.7 1.8

题目解答
答案

解析
本题主要考察线性回归分析在多变量关系研究中的应用,具体涉及单因素回归与多因素回归的对比、回归系数的意义解读以及混杂因素的判断。
核心知识点
- 单因素线性回归:分析单个自变量(如年龄X1或体重指数X2)与因变量(C反应蛋白Y)的线性关系,通过回归系数和P值判断显著性。
- 多因素线性回归:同时引入多个自变量(X1和X2),观察自变量间的相互影响,判断每个自变量在控制其他变量后对因变量的独立作用。
- 混杂因素:若一个变量(如X2)同时与自变量(X1)和因变量(Y)相关,可能导致自变量与因变量的单因素关联被扭曲,称为混杂。
题目分析
1. 单因素回归结果
- 回归方程(13-9)(X1与Y):
回归系数$\hat{\beta}_1=0.029$,$t=25.263$,$P<0.001$,提示年龄X1与Y单因素相关显著。 - 回归方程(13-10)(X2与Y):
回归系数$\hat{\beta}_2=0.251$,$t=7.061$,$P<0.001$,提示体重指数X2与Y单因素相关显著。
2. 多因素回归结果(方程13-11:$Y=\beta_1X1+\beta_2X2$)
- X1的回归系数:$\hat{\beta}_1=0.004$,$t=0.520$,$P=0.605>0.05$,无统计学意义,且系数较单因素时大幅减小(从0.029降至0.004)。
- X2的回归系数:$\hat{\beta}_2=0.233$,$t=4.634$,$P<0.001$,仍显著,系数变化较小(从0.251降至0.233)。
- 结论:X1与Y的单因素关联可能被X2混杂(X2与X1、Y均相关),控制X2后,X1与Y无独立关联。
3. 逐步回归结果
仅X2进入回归方程,方程为$\hat{\mu}_Y=-4.320+0.251X2$(或题目中修正的$\hat{\mu}_Y=-4.521+0.251X_{20}$,可能为笔误),提示Y仅与X2存在线性回归关系。