logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

比亚迪,这个中国品牌的乘用车,如今已经在全球汽车品牌销量前十中占据一席之地.这一成就是中国新能源汽车行业的里程碑,标志着中国已经在全球范围内成为了新能源汽车领域的强国.现统计了自上市以来截止到2023年8月的宋plus的月销量数据.(1)通过调查研究发现,其他新能源汽车的崛起、购置税减免政策的颁布等,影响了该款汽车的月销量,现将残差过大的数据剔除掉,得到2022年8月至2023年8月部分月份月销量y(单位:万辆)和月份编号x的成对样本数据统计.月份2022年8月2022年9月2022年12月2023年1月2023年2月2023年3月2023年4月2023年6月2023年7月2023年8月月份编号12345678910月销量(单位:万辆)4.254.594.993.563.723.012.462.723.023.28请用样本相关系数说明y与x之间的关系可否用一元线性回归模型拟合?若能,求出y关于x的经验回归方程;若不能,请说明理由.(运算过程及结果均精确到0.01,若|r| gt 0.75,则线性相关程度很高,可用一元线性回归模型拟合)(2)为迎接2024新春佳节,某地4S店特推出盲盒抽奖营销活动中,店家将从一批汽车模型中随机抽取50个装入盲盒用于抽奖,已知抽出的50个汽车模型的外观和内饰的颜色分布如下表所示.红色外观蓝色外观棕色内饰2010米色内饰155①从这50个模型中随机取1个,用A表示事件“取出的模型外观为红色”,用B表示事件“取出的模型内饰为米色”,求P(B)和P(B|A),并判断事件A与B是否相互独立;②活动规定:在一次抽奖中,每人可以一次性拿2个盲盒.对其中的模型给出以下假设:假设1:拿到的2个模型会出现3种结果,即外观和内饰均为同色、外观和内饰都异色以及仅外观或仅内饰同色.假设2:按结果的可能性大小,概率越小奖项越高.假设3:该抽奖活动的奖金额为一等奖3000元、二等奖2000元、三等奖1000元.请你分析奖项对应的结果,设X为奖金额,写出X的分布列并求出X的期望(精确到元)。参考公式:样本相关系数r=(sum_(i=1)^n)/(((x)_{i-overline{x))}((y)_(i)-overline(y))}(sqrt(sum_{i=1)^n{{({x)_(i)-overline(x))}^2}sum_(i=1)^n({({y)_(i)-overline(y))}^2}}}=(sum_(i=1)^n)/((x)_{i)(y)_(i)-noverline(x)overline(y)}(sqrt((sum_{i=1)^n{{x)_(i)^2}-noverline(x)^2)}sqrt((sum_(i=1)^n{{y)_(i)^2}-nbar(y)^2)}},hat(b)=(sum_(i=1)^n)/(((x)_{i-bar{x))}((y)_(i)-overline(y))}(sum_{i=1)^n({({x)_(i)-overline(x))}^2}}=(sum_(i=1)^n)/((x)_{i)(y)_(i)-noverline(x)overline(y)}(sum_{i=1)^n({x)_(i)^2}-noverline(x)^2},hat(a)=overline(y)-hat(b)overline(x).参考数据:sum_(i=1)^10({x)_(i)}(y)_(i)=178.26,bar(x)bar(y)=19.58,sum_(i=1)^10({x)_(i)^2}-10overline(x)^2=82.5,sum_(i=1)^10({y)_(i)^2}-10overline(y)^2≈6.20,sqrt(82.5)×sqrt(6.20)≈22.62.

比亚迪,这个中国品牌的乘用车,如今已经在全球汽车品牌销量前十中占据一席之地.这一成就是中国新能源汽车行业的里程碑,标志着中国已经在全球范围内成为了新能源汽车领域的强国.现统计了自上市以来截止到$2023$年$8$月的宋$plus$的月销量数据.
$(1)$通过调查研究发现,其他新能源汽车的崛起、购置税减免政策的颁布等,影响了该款汽车的月销量,现将残差过大的数据剔除掉,得到$2022$年$8$月至$2023$年$8$月部分月份月销量$y(单位:万辆)$和月份编号$x$的成对样本数据统计.
月份$2022$年$8$月$2022$年$9$月$2022$年$12$月$2023$年$1$月$2023$年$2$月$2023$年$3$月$2023$年$4$月$2023$年$6$月$2023$年$7$月$2023$年$8$月
月份编号$1$$2$$3$$4$$5$$6$$7$$8$$9$$10$
月销量(单位:万辆)$4.25$$4.59$$4.99$$3.56$$3.72$$3.01$$2.46$$2.72$$3.02$$3.28$
请用样本相关系数说明$y$与$x$之间的关系可否用一元线性回归模型拟合?若能,求出$y$关于$x$的经验回归方程;若不能,请说明理由.(运算过程及结果均精确到$0.01$,若$|r| \gt 0.75$,则线性相关程度很高,可用一元线性回归模型拟合)
$(2)$为迎接$2024$新春佳节,某地$4S$店特推出盲盒抽奖营销活动中,店家将从一批汽车模型中随机抽取$50$个装入盲盒用于抽奖,已知抽出的$50$个汽车模型的外观和内饰的颜色分布如下表所示.
红色外观蓝色外观
棕色内饰$20$$10$
米色内饰$15$$5$
①从这$50$个模型中随机取$1$个,用$A$表示事件“取出的模型外观为红色”,用$B$表示事件“取出的模型内饰为米色”,求$P\left(B\right)$和$P\left(B|A\right)$,并判断事件$A$与$B$是否相互独立;
②活动规定:在一次抽奖中,每人可以一次性拿$2$个盲盒.对其中的模型给出以下假设:假设$1$:拿到的$2$个模型会出现$3$种结果,即外观和内饰均为同色、外观和内饰都异色以及仅外观或仅内饰同色.假设$2$:按结果的可能性大小,概率越小奖项越高.假设$3$:该抽奖活动的奖金额为一等奖$3000$元、二等奖$2000$元、三等奖$1000$元.请你分析奖项对应的结果,设$X$为奖金额,写出$X$的分布列并求出$X$的期望(精确到元)。
参考公式:样本相关系数$r=\frac{\sum_{i=1}^{n}{({x}_{i}-\overline{x})}({y}_{i}-\overline{y})}{\sqrt{\sum_{i=1}^{n}{{({x}_{i}-\overline{x})}^{2}}\sum_{i=1}^{n}{{({y}_{i}-\overline{y})}^{2}}}}=\frac{\sum_{i=1}^{n}{{x}_{i}}{y}_{i}-n\overline{x}\overline{y}}{\sqrt{(\sum_{i=1}^{n}{{x}_{i}^{2}}-n\overline{x}^{2})}\sqrt{(\sum_{i=1}^{n}{{y}_{i}^{2}}-n\bar{y}^{2})}}$,
$\hat{b}=\frac{\sum_{i=1}^{n}{({x}_{i}-\bar{x})}({y}_{i}-\overline{y})}{\sum_{i=1}^{n}{{({x}_{i}-\overline{x})}^{2}}}=\frac{\sum_{i=1}^{n}{{x}_{i}}{y}_{i}-n\overline{x}\overline{y}}{\sum_{i=1}^{n}{{x}_{i}^{2}}-n\overline{x}^{2}}$,$\hat{a}=\overline{y}-\hat{b}\overline{x}$.
参考数据:$\sum_{i=1}^{10}{{x}_{i}}{y}_{i}=178.26,\bar{x}\bar{y}=19.58,\sum_{i=1}^{10}{{x}_{i}^{2}}-10\overline{x}^{2}=82.5,\sum_{i=1}^{10}{{y}_{i}^{2}}-10\overline{y}^{2}≈6.20$,$\sqrt{82.5}×\sqrt{6.20}≈22.62$.

题目解答

答案

(1)由题$\overline{x}=\frac{1+2+3+⋯+10}{10}=5.50$,
$\overline{y}=\frac{4.25+4.59+4.99+3.56+3.72+3.01+2.46+2.72+3.02+3.28}{10}=3.56$,
则$r=\frac{\sum_{i=1}^{10}{{x}_{i}}{y}_{i}-10\overline{x}\overline{y}}{\sqrt{(\sum_{i=1}^{10}{{x}_{i}^{2}}-10\overline{x}^{2})}\sqrt{(\sum_{i=1}^{10}{{y}_{i}^{2}}-10\overline{y}^{2})}}≈\frac{178.26-10×5.5×3.56}{\sqrt{82.5}×\sqrt{6.2}}≈\frac{-17.54}{22.62}≈-0.78$,
因为$|r| \gt 0.75$,所以可以使用一元线性回归模型拟合;
又$\hat{b}=\frac{\sum_{i=1}^{10}{{x}_{i}}{y}_{i}-10\overline{x}\overline{y}}{\sum_{i=1}^{10}{{x}_{i}^{2}}-10\overline{x}^{2}}=\frac{178.26-10×5.5×3.56}{82.5}=\frac{-17.54}{82.5}≈-0.21$,
$\hat{a}=\overline{y}-\hat{b}\overline{x}=3.56+0.21×5.5=4.715≈4.72$,
故回归方程为:$\hat{y}=-0.21x+4.72$;
$(2)$①模型内饰为米色的共有$20$个,所以$P(B)=\frac{{C}_{20}^{1}}{{C}_{50}^{1}}=\frac{2}{5}$,
红色外观的模型有$35$个,其中内饰为米色的共有$15$个,所以$P(B|A)=\frac{{C}_{15}^{1}}{{C}_{35}^{1}}=\frac{3}{7}$,
红色外观模型且内饰为米色的共有$15$个,所以$P(AB)=\frac{{C}_{15}^{1}}{{C}_{50}^{1}}=\frac{3}{10}$,
$P(A)=\frac{{C}_{35}^{1}}{{C}_{50}^{1}}=\frac{7}{10}$,因为$P\left(AB\right)\neq P\left(A\right)P\left(B\right)$,
所以$A$,$B$不独立;
②设事件$C=$“取出的模型外观和内饰均为同色”,
事件$D=$“取出的模型外观和内饰都异色”,
事件$E=$“仅外观或仅内饰同色”,
则$P(C)=\frac{{C}_{20}^{2}+{C}_{10}^{2}+{C}_{15}^{2}+{C}_{5}^{2}}{{C}_{50}^{2}}=\frac{2}{7}$,
$P(D)=\frac{{C}_{20}^{1}{C}_{5}^{1}+{C}_{10}^{1}{C}_{15}^{1}}{{C}_{50}^{2}}=\frac{10}{49}$,
$P(E)=\frac{{C}_{20}^{1}{C}_{15}^{1}+{C}_{10}^{1}{C}_{5}^{1}+{C}_{20}^{1}{C}_{10}^{1}+{C}_{15}^{1}{C}_{5}^{1}}{{C}_{50}^{2}}=\frac{25}{49}$,
因为$P\left(E\right) \gt P\left(C\right) \gt P\left(D\right)$,
所以获得一等奖的概率为$\frac{10}{49}$,二等奖的概率为$\frac{2}{7}$,三等奖的概率为$\frac{25}{49}$,
由题,$X$的取值可能为:$3000$,$2000$,$1000$,
所以$X$的分布列为:
$X$$3000$$2000$$1000$
$p$$\frac{10}{49}$$\frac{2}{7}$$\frac{25}{49}$
则$E(X)=3000×\frac{10}{49}+2000×\frac{2}{7}+1000×\frac{25}{49}≈1694$.

相关问题

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号