题目
比亚迪,这个中国品牌的乘用车,如今已经在全球汽车品牌销量前十中占据一席之地.这一成就是中国新能源汽车行业的里程碑,标志着中国已经在全球范围内成为了新能源汽车领域的强国.现统计了自上市以来截止到2023年8月的宋plus的月销量数据.(1)通过调查研究发现,其他新能源汽车的崛起、购置税减免政策的颁布等,影响了该款汽车的月销量,现将残差过大的数据剔除掉,得到2022年8月至2023年8月部分月份月销量y(单位:万辆)和月份编号x的成对样本数据统计.月份2022年8月2022年9月2022年12月2023年1月2023年2月2023年3月2023年4月2023年6月2023年7月2023年8月月份编号12345678910月销量(单位:万辆)4.254.594.993.563.723.012.462.723.023.28请用样本相关系数说明y与x之间的关系可否用一元线性回归模型拟合?若能,求出y关于x的经验回归方程;若不能,请说明理由.(运算过程及结果均精确到0.01,若|r| gt 0.75,则线性相关程度很高,可用一元线性回归模型拟合)(2)为迎接2024新春佳节,某地4S店特推出盲盒抽奖营销活动中,店家将从一批汽车模型中随机抽取50个装入盲盒用于抽奖,已知抽出的50个汽车模型的外观和内饰的颜色分布如下表所示.红色外观蓝色外观棕色内饰2010米色内饰155①从这50个模型中随机取1个,用A表示事件“取出的模型外观为红色”,用B表示事件“取出的模型内饰为米色”,求P(B)和P(B|A),并判断事件A与B是否相互独立;②活动规定:在一次抽奖中,每人可以一次性拿2个盲盒.对其中的模型给出以下假设:假设1:拿到的2个模型会出现3种结果,即外观和内饰均为同色、外观和内饰都异色以及仅外观或仅内饰同色.假设2:按结果的可能性大小,概率越小奖项越高.假设3:该抽奖活动的奖金额为一等奖3000元、二等奖2000元、三等奖1000元.请你分析奖项对应的结果,设X为奖金额,写出X的分布列并求出X的期望(精确到元)。参考公式:样本相关系数r=(sum_(i=1)^n)/(((x)_{i-overline{x))}((y)_(i)-overline(y))}(sqrt(sum_{i=1)^n{{({x)_(i)-overline(x))}^2}sum_(i=1)^n({({y)_(i)-overline(y))}^2}}}=(sum_(i=1)^n)/((x)_{i)(y)_(i)-noverline(x)overline(y)}(sqrt((sum_{i=1)^n{{x)_(i)^2}-noverline(x)^2)}sqrt((sum_(i=1)^n{{y)_(i)^2}-nbar(y)^2)}},hat(b)=(sum_(i=1)^n)/(((x)_{i-bar{x))}((y)_(i)-overline(y))}(sum_{i=1)^n({({x)_(i)-overline(x))}^2}}=(sum_(i=1)^n)/((x)_{i)(y)_(i)-noverline(x)overline(y)}(sum_{i=1)^n({x)_(i)^2}-noverline(x)^2},hat(a)=overline(y)-hat(b)overline(x).参考数据:sum_(i=1)^10({x)_(i)}(y)_(i)=178.26,bar(x)bar(y)=19.58,sum_(i=1)^10({x)_(i)^2}-10overline(x)^2=82.5,sum_(i=1)^10({y)_(i)^2}-10overline(y)^2≈6.20,sqrt(82.5)×sqrt(6.20)≈22.62.
比亚迪,这个中国品牌的乘用车,如今已经在全球汽车品牌销量前十中占据一席之地.这一成就是中国新能源汽车行业的里程碑,标志着中国已经在全球范围内成为了新能源汽车领域的强国.现统计了自上市以来截止到$2023$年$8$月的宋$plus$的月销量数据.
$(1)$通过调查研究发现,其他新能源汽车的崛起、购置税减免政策的颁布等,影响了该款汽车的月销量,现将残差过大的数据剔除掉,得到$2022$年$8$月至$2023$年$8$月部分月份月销量$y(单位:万辆)$和月份编号$x$的成对样本数据统计.
请用样本相关系数说明$y$与$x$之间的关系可否用一元线性回归模型拟合?若能,求出$y$关于$x$的经验回归方程;若不能,请说明理由.(运算过程及结果均精确到$0.01$,若$|r| \gt 0.75$,则线性相关程度很高,可用一元线性回归模型拟合)
$(2)$为迎接$2024$新春佳节,某地$4S$店特推出盲盒抽奖营销活动中,店家将从一批汽车模型中随机抽取$50$个装入盲盒用于抽奖,已知抽出的$50$个汽车模型的外观和内饰的颜色分布如下表所示.
①从这$50$个模型中随机取$1$个,用$A$表示事件“取出的模型外观为红色”,用$B$表示事件“取出的模型内饰为米色”,求$P\left(B\right)$和$P\left(B|A\right)$,并判断事件$A$与$B$是否相互独立;
②活动规定:在一次抽奖中,每人可以一次性拿$2$个盲盒.对其中的模型给出以下假设:假设$1$:拿到的$2$个模型会出现$3$种结果,即外观和内饰均为同色、外观和内饰都异色以及仅外观或仅内饰同色.假设$2$:按结果的可能性大小,概率越小奖项越高.假设$3$:该抽奖活动的奖金额为一等奖$3000$元、二等奖$2000$元、三等奖$1000$元.请你分析奖项对应的结果,设$X$为奖金额,写出$X$的分布列并求出$X$的期望(精确到元)。
参考公式:样本相关系数$r=\frac{\sum_{i=1}^{n}{({x}_{i}-\overline{x})}({y}_{i}-\overline{y})}{\sqrt{\sum_{i=1}^{n}{{({x}_{i}-\overline{x})}^{2}}\sum_{i=1}^{n}{{({y}_{i}-\overline{y})}^{2}}}}=\frac{\sum_{i=1}^{n}{{x}_{i}}{y}_{i}-n\overline{x}\overline{y}}{\sqrt{(\sum_{i=1}^{n}{{x}_{i}^{2}}-n\overline{x}^{2})}\sqrt{(\sum_{i=1}^{n}{{y}_{i}^{2}}-n\bar{y}^{2})}}$,
$\hat{b}=\frac{\sum_{i=1}^{n}{({x}_{i}-\bar{x})}({y}_{i}-\overline{y})}{\sum_{i=1}^{n}{{({x}_{i}-\overline{x})}^{2}}}=\frac{\sum_{i=1}^{n}{{x}_{i}}{y}_{i}-n\overline{x}\overline{y}}{\sum_{i=1}^{n}{{x}_{i}^{2}}-n\overline{x}^{2}}$,$\hat{a}=\overline{y}-\hat{b}\overline{x}$.
参考数据:$\sum_{i=1}^{10}{{x}_{i}}{y}_{i}=178.26,\bar{x}\bar{y}=19.58,\sum_{i=1}^{10}{{x}_{i}^{2}}-10\overline{x}^{2}=82.5,\sum_{i=1}^{10}{{y}_{i}^{2}}-10\overline{y}^{2}≈6.20$,$\sqrt{82.5}×\sqrt{6.20}≈22.62$.
$(1)$通过调查研究发现,其他新能源汽车的崛起、购置税减免政策的颁布等,影响了该款汽车的月销量,现将残差过大的数据剔除掉,得到$2022$年$8$月至$2023$年$8$月部分月份月销量$y(单位:万辆)$和月份编号$x$的成对样本数据统计.
| 月份 | $2022$年$8$月 | $2022$年$9$月 | $2022$年$12$月 | $2023$年$1$月 | $2023$年$2$月 | $2023$年$3$月 | $2023$年$4$月 | $2023$年$6$月 | $2023$年$7$月 | $2023$年$8$月 |
| 月份编号 | $1$ | $2$ | $3$ | $4$ | $5$ | $6$ | $7$ | $8$ | $9$ | $10$ |
| 月销量(单位:万辆) | $4.25$ | $4.59$ | $4.99$ | $3.56$ | $3.72$ | $3.01$ | $2.46$ | $2.72$ | $3.02$ | $3.28$ |
$(2)$为迎接$2024$新春佳节,某地$4S$店特推出盲盒抽奖营销活动中,店家将从一批汽车模型中随机抽取$50$个装入盲盒用于抽奖,已知抽出的$50$个汽车模型的外观和内饰的颜色分布如下表所示.
| 红色外观 | 蓝色外观 | |
| 棕色内饰 | $20$ | $10$ |
| 米色内饰 | $15$ | $5$ |
②活动规定:在一次抽奖中,每人可以一次性拿$2$个盲盒.对其中的模型给出以下假设:假设$1$:拿到的$2$个模型会出现$3$种结果,即外观和内饰均为同色、外观和内饰都异色以及仅外观或仅内饰同色.假设$2$:按结果的可能性大小,概率越小奖项越高.假设$3$:该抽奖活动的奖金额为一等奖$3000$元、二等奖$2000$元、三等奖$1000$元.请你分析奖项对应的结果,设$X$为奖金额,写出$X$的分布列并求出$X$的期望(精确到元)。
参考公式:样本相关系数$r=\frac{\sum_{i=1}^{n}{({x}_{i}-\overline{x})}({y}_{i}-\overline{y})}{\sqrt{\sum_{i=1}^{n}{{({x}_{i}-\overline{x})}^{2}}\sum_{i=1}^{n}{{({y}_{i}-\overline{y})}^{2}}}}=\frac{\sum_{i=1}^{n}{{x}_{i}}{y}_{i}-n\overline{x}\overline{y}}{\sqrt{(\sum_{i=1}^{n}{{x}_{i}^{2}}-n\overline{x}^{2})}\sqrt{(\sum_{i=1}^{n}{{y}_{i}^{2}}-n\bar{y}^{2})}}$,
$\hat{b}=\frac{\sum_{i=1}^{n}{({x}_{i}-\bar{x})}({y}_{i}-\overline{y})}{\sum_{i=1}^{n}{{({x}_{i}-\overline{x})}^{2}}}=\frac{\sum_{i=1}^{n}{{x}_{i}}{y}_{i}-n\overline{x}\overline{y}}{\sum_{i=1}^{n}{{x}_{i}^{2}}-n\overline{x}^{2}}$,$\hat{a}=\overline{y}-\hat{b}\overline{x}$.
参考数据:$\sum_{i=1}^{10}{{x}_{i}}{y}_{i}=178.26,\bar{x}\bar{y}=19.58,\sum_{i=1}^{10}{{x}_{i}^{2}}-10\overline{x}^{2}=82.5,\sum_{i=1}^{10}{{y}_{i}^{2}}-10\overline{y}^{2}≈6.20$,$\sqrt{82.5}×\sqrt{6.20}≈22.62$.
题目解答
答案
(1)由题$\overline{x}=\frac{1+2+3+⋯+10}{10}=5.50$,
$\overline{y}=\frac{4.25+4.59+4.99+3.56+3.72+3.01+2.46+2.72+3.02+3.28}{10}=3.56$,
则$r=\frac{\sum_{i=1}^{10}{{x}_{i}}{y}_{i}-10\overline{x}\overline{y}}{\sqrt{(\sum_{i=1}^{10}{{x}_{i}^{2}}-10\overline{x}^{2})}\sqrt{(\sum_{i=1}^{10}{{y}_{i}^{2}}-10\overline{y}^{2})}}≈\frac{178.26-10×5.5×3.56}{\sqrt{82.5}×\sqrt{6.2}}≈\frac{-17.54}{22.62}≈-0.78$,
因为$|r| \gt 0.75$,所以可以使用一元线性回归模型拟合;
又$\hat{b}=\frac{\sum_{i=1}^{10}{{x}_{i}}{y}_{i}-10\overline{x}\overline{y}}{\sum_{i=1}^{10}{{x}_{i}^{2}}-10\overline{x}^{2}}=\frac{178.26-10×5.5×3.56}{82.5}=\frac{-17.54}{82.5}≈-0.21$,
$\hat{a}=\overline{y}-\hat{b}\overline{x}=3.56+0.21×5.5=4.715≈4.72$,
故回归方程为:$\hat{y}=-0.21x+4.72$;
$(2)$①模型内饰为米色的共有$20$个,所以$P(B)=\frac{{C}_{20}^{1}}{{C}_{50}^{1}}=\frac{2}{5}$,
红色外观的模型有$35$个,其中内饰为米色的共有$15$个,所以$P(B|A)=\frac{{C}_{15}^{1}}{{C}_{35}^{1}}=\frac{3}{7}$,
红色外观模型且内饰为米色的共有$15$个,所以$P(AB)=\frac{{C}_{15}^{1}}{{C}_{50}^{1}}=\frac{3}{10}$,
$P(A)=\frac{{C}_{35}^{1}}{{C}_{50}^{1}}=\frac{7}{10}$,因为$P\left(AB\right)\neq P\left(A\right)P\left(B\right)$,
所以$A$,$B$不独立;
②设事件$C=$“取出的模型外观和内饰均为同色”,
事件$D=$“取出的模型外观和内饰都异色”,
事件$E=$“仅外观或仅内饰同色”,
则$P(C)=\frac{{C}_{20}^{2}+{C}_{10}^{2}+{C}_{15}^{2}+{C}_{5}^{2}}{{C}_{50}^{2}}=\frac{2}{7}$,
$P(D)=\frac{{C}_{20}^{1}{C}_{5}^{1}+{C}_{10}^{1}{C}_{15}^{1}}{{C}_{50}^{2}}=\frac{10}{49}$,
$P(E)=\frac{{C}_{20}^{1}{C}_{15}^{1}+{C}_{10}^{1}{C}_{5}^{1}+{C}_{20}^{1}{C}_{10}^{1}+{C}_{15}^{1}{C}_{5}^{1}}{{C}_{50}^{2}}=\frac{25}{49}$,
因为$P\left(E\right) \gt P\left(C\right) \gt P\left(D\right)$,
所以获得一等奖的概率为$\frac{10}{49}$,二等奖的概率为$\frac{2}{7}$,三等奖的概率为$\frac{25}{49}$,
由题,$X$的取值可能为:$3000$,$2000$,$1000$,
所以$X$的分布列为:
则$E(X)=3000×\frac{10}{49}+2000×\frac{2}{7}+1000×\frac{25}{49}≈1694$.
$\overline{y}=\frac{4.25+4.59+4.99+3.56+3.72+3.01+2.46+2.72+3.02+3.28}{10}=3.56$,
则$r=\frac{\sum_{i=1}^{10}{{x}_{i}}{y}_{i}-10\overline{x}\overline{y}}{\sqrt{(\sum_{i=1}^{10}{{x}_{i}^{2}}-10\overline{x}^{2})}\sqrt{(\sum_{i=1}^{10}{{y}_{i}^{2}}-10\overline{y}^{2})}}≈\frac{178.26-10×5.5×3.56}{\sqrt{82.5}×\sqrt{6.2}}≈\frac{-17.54}{22.62}≈-0.78$,
因为$|r| \gt 0.75$,所以可以使用一元线性回归模型拟合;
又$\hat{b}=\frac{\sum_{i=1}^{10}{{x}_{i}}{y}_{i}-10\overline{x}\overline{y}}{\sum_{i=1}^{10}{{x}_{i}^{2}}-10\overline{x}^{2}}=\frac{178.26-10×5.5×3.56}{82.5}=\frac{-17.54}{82.5}≈-0.21$,
$\hat{a}=\overline{y}-\hat{b}\overline{x}=3.56+0.21×5.5=4.715≈4.72$,
故回归方程为:$\hat{y}=-0.21x+4.72$;
$(2)$①模型内饰为米色的共有$20$个,所以$P(B)=\frac{{C}_{20}^{1}}{{C}_{50}^{1}}=\frac{2}{5}$,
红色外观的模型有$35$个,其中内饰为米色的共有$15$个,所以$P(B|A)=\frac{{C}_{15}^{1}}{{C}_{35}^{1}}=\frac{3}{7}$,
红色外观模型且内饰为米色的共有$15$个,所以$P(AB)=\frac{{C}_{15}^{1}}{{C}_{50}^{1}}=\frac{3}{10}$,
$P(A)=\frac{{C}_{35}^{1}}{{C}_{50}^{1}}=\frac{7}{10}$,因为$P\left(AB\right)\neq P\left(A\right)P\left(B\right)$,
所以$A$,$B$不独立;
②设事件$C=$“取出的模型外观和内饰均为同色”,
事件$D=$“取出的模型外观和内饰都异色”,
事件$E=$“仅外观或仅内饰同色”,
则$P(C)=\frac{{C}_{20}^{2}+{C}_{10}^{2}+{C}_{15}^{2}+{C}_{5}^{2}}{{C}_{50}^{2}}=\frac{2}{7}$,
$P(D)=\frac{{C}_{20}^{1}{C}_{5}^{1}+{C}_{10}^{1}{C}_{15}^{1}}{{C}_{50}^{2}}=\frac{10}{49}$,
$P(E)=\frac{{C}_{20}^{1}{C}_{15}^{1}+{C}_{10}^{1}{C}_{5}^{1}+{C}_{20}^{1}{C}_{10}^{1}+{C}_{15}^{1}{C}_{5}^{1}}{{C}_{50}^{2}}=\frac{25}{49}$,
因为$P\left(E\right) \gt P\left(C\right) \gt P\left(D\right)$,
所以获得一等奖的概率为$\frac{10}{49}$,二等奖的概率为$\frac{2}{7}$,三等奖的概率为$\frac{25}{49}$,
由题,$X$的取值可能为:$3000$,$2000$,$1000$,
所以$X$的分布列为:
| $X$ | $3000$ | $2000$ | $1000$ |
| $p$ | $\frac{10}{49}$ | $\frac{2}{7}$ | $\frac{25}{49}$ |