题目
已知变量 x和变量 y的一组成对样本数据为 (x_i, y_i)(i=1,2,3,...,8),其中 overline(x)=(9)/(8),其回归直线方程为 y=2x-(1)/(4),当增加两个样本数据 (-1,5)和 (2,9)后,重新得到的回归直线方程斜率为 3,则在新的回归直线方程的估计下,样本数据 (4,10)所对应的残差为()A. -3B. -2C. -1D. 1
已知变量 $x$和变量 $y$的一组成对样本数据为 $(x_i, y_i)(i=1,2,3,\cdots,8)$,其中 $\overline{x}=\frac{9}{8}$,其回归直线方程为 $y=2x-\frac{1}{4}$,当增加两个样本数据 $(-1,5)$和 $(2,9)$后,重新得到的回归直线方程斜率为 3,则在新的回归直线方程的估计下,样本数据 $(4,10)$所对应的残差为()
A. -3
B. -2
C. -1
D. 1
题目解答
答案
B. -2
解析
考查要点:本题主要考查回归分析中的样本中心点、回归方程求解以及残差计算。关键在于理解回归直线必过样本中心点的性质,并能根据新数据调整中心点后重新求解回归方程。
解题思路:
- 确定原样本中心点:利用原回归方程和已知的$\overline{x}$,计算对应的$\overline{y}$。
- 计算新样本中心点:根据新增数据调整总和,求出新的$\overline{x'}$和$\overline{y'}$。
- 求新回归方程:已知斜率$k=3$,结合新中心点确定截距$b$。
- 计算残差:用新回归方程预测$y$值,与实际值比较得到残差。
1. 原样本中心点
原回归方程为$y=2x-\frac{1}{4}$,已知$\overline{x}=\frac{9}{8}$,代入方程得:
$\overline{y} = 2 \cdot \frac{9}{8} - \frac{1}{4} = \frac{9}{4} - \frac{1}{4} = 2$
因此,原样本中心点为$\left( \frac{9}{8}, 2 \right)$。
2. 新样本中心点
新增数据$(-1,5)$和$(2,9)$后,总样本数变为$10$:
- 新$\overline{x'}$:原$x$总和为$8 \cdot \frac{9}{8} = 9$,新增$-1$和$2$,总和为$9 + (-1) + 2 = 10$,故$\overline{x'} = \frac{10}{10} = 1$。
- 新$\overline{y'}$:原$y$总和为$8 \cdot 2 = 16$,新增$5$和$9$,总和为$16 + 5 + 9 = 30$,故$\overline{y'} = \frac{30}{10} = 3$。
因此,新样本中心点为$(1, 3)$。
3. 新回归方程
已知斜率$k=3$,回归方程形式为$\hat{y} = 3x + b$。代入中心点$(1, 3)$:
$3 = 3 \cdot 1 + b \implies b = 0$
因此,新回归方程为$\hat{y} = 3x$。
4. 残差计算
对于样本$(4, 10)$,预测值$\hat{y} = 3 \cdot 4 = 12$,残差为:
$\text{残差} = 10 - 12 = -2$