题目

已知变量 x和变量 y的一组成对样本数据为 (x_i, y_i)(i=1,2,3,...,8)，其中 overline(x)=(9)/(8)，其回归直线方程为 y=2x-(1)/(4)，当增加两个样本数据 (-1,5)和 (2,9)后，重新得到的回归直线方程斜率为 3，则在新的回归直线方程的估计下，样本数据 (4,10)所对应的残差为（）A. -3B. -2C. -1D. 1

已知变量 $x$和变量 $y$的一组成对样本数据为 $(x_i, y_i)(i=1,2,3,\cdots,8)$，其中 $\overline{x}=\frac{9}{8}$，其回归直线方程为 $y=2x-\frac{1}{4}$，当增加两个样本数据 $(-1,5)$和 $(2,9)$后，重新得到的回归直线方程斜率为 3，则在新的回归直线方程的估计下，样本数据 $(4,10)$所对应的残差为（）

A. -3

B. -2

C. -1

D. 1

题目解答

答案

B. -2

解析

考查要点：本题主要考查回归分析中的样本中心点、回归方程求解以及残差计算。关键在于理解回归直线必过样本中心点的性质，并能根据新数据调整中心点后重新求解回归方程。

解题思路：

确定原样本中心点：利用原回归方程和已知的$\overline{x}$，计算对应的$\overline{y}$。
计算新样本中心点：根据新增数据调整总和，求出新的$\overline{x'}$和$\overline{y'}$。
求新回归方程：已知斜率$k=3$，结合新中心点确定截距$b$。
计算残差：用新回归方程预测$y$值，与实际值比较得到残差。

1. 原样本中心点

原回归方程为$y=2x-\frac{1}{4}$，已知$\overline{x}=\frac{9}{8}$，代入方程得：
$\overline{y} = 2 \cdot \frac{9}{8} - \frac{1}{4} = \frac{9}{4} - \frac{1}{4} = 2$
因此，原样本中心点为$\left( \frac{9}{8}, 2 \right)$。

2. 新样本中心点

新增数据$(-1,5)$和$(2,9)$后，总样本数变为$10$：

新$\overline{x'}$：原$x$总和为$8 \cdot \frac{9}{8} = 9$，新增$-1$和$2$，总和为$9 + (-1) + 2 = 10$，故$\overline{x'} = \frac{10}{10} = 1$。
新$\overline{y'}$：原$y$总和为$8 \cdot 2 = 16$，新增$5$和$9$，总和为$16 + 5 + 9 = 30$，故$\overline{y'} = \frac{30}{10} = 3$。
因此，新样本中心点为$(1, 3)$。

3. 新回归方程

已知斜率$k=3$，回归方程形式为$\hat{y} = 3x + b$。代入中心点$(1, 3)$：
$3 = 3 \cdot 1 + b \implies b = 0$
因此，新回归方程为$\hat{y} = 3x$。

4. 残差计算

对于样本$(4, 10)$，预测值$\hat{y} = 3 \cdot 4 = 12$，残差为：
$\text{残差} = 10 - 12 = -2$