logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

某校20名学生的数学成绩xi(i=1,2,•••,20)和知识竞赛成绩yi(i=1,2,•••,20)如下表: 学生编号i 1 2 3 4 5 6 7 8 9 10 数学成绩xi 100 99 96 93 90 88 85 83 80 77 知识竞赛成绩yi 290 160 220 200 65 70 90 100 60 270 学生编号i 11 12 13 14 15 16 17 18 19 20 数学成绩xi 75 74 72 70 68 66 60 50 39 35 知识竞赛成绩yi 45 35 40 50 25 30 20 15 10 5 计算可得数学成绩的平均值是overline(x)=75,知识竞赛成绩的平均值是overline(y)=90,并且sum_(i=1)^20({({x)_(i)-overline(x))}^2}=6464,sum_(i=1)^20({({y)_(i)-overline(y))}^2}=149450,sum_(i=1)^20(({x)_(i)-overline(x))}((y)_(i)-overline(y))=21650.(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01);(2)设N∈N*,变量x和变量y的一组样本数据为((xi,yi)|i=1,2,•••,N),其中xi(i=1,2,•••,N)两两不相同,yi(i=1,2,•••,N)两两不相同.记xi在(xn|n=1,2,•••,N)中的排名是第Ri位,yi在(yn|n=1,2,•••,N)中的排名是第Si位,i=1,2,•••,N.定义变量x和变量y的“斯皮尔曼相关系数”(记为ρ)为变量x的排名和变量y的排名的样本相关系数.(i)记di=Ri-Si,i=1,2,•••,N.证明:ρ=1-(6)/(N((N)^2-1))sum_(i=1)^N({d)_(i)^2};(ii)用(i)的公式求得这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”约为0.91,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.注:参考公式与参考数据.r=(sum_(i=1)^n)/(((x)_{i-overline{x))}((y)_(i)-overline(y))}(sqrt(sum_{i=1)^n{{({x)_(i)-overline(x))}^2}sum_(i=1)^n({({y)_(i)-overline(y))}^2}}};sum_(k=1)^n({k)^2}=(n(n+1)(2n+1))/(6);sqrt(6464×149450)≈31000.

某校20名学生的数学成绩xi(i=1,2,•••,20)和知识竞赛成绩yi(i=1,2,•••,20)如下表:
学生编号i 1 2 3 4 5 6 7 8 9 10
数学成绩xi 100 99 96 93 90 88 85 83 80 77
知识竞赛成绩yi 290 160 220 200 65 70 90 100 60 270
学生编号i 11 12 13 14 15 16 17 18 19 20
数学成绩xi 75 74 72 70 68 66 60 50 39 35
知识竞赛成绩yi 45 35 40 50 25 30 20 15 10 5
计算可得数学成绩的平均值是$\overline{x}=75$,知识竞赛成绩的平均值是$\overline{y}=90$,并且$\sum_{i=1}^{20}{{({x}_{i}-\overline{x})}^{2}}=6464$,$\sum_{i=1}^{20}{{({y}_{i}-\overline{y})}^{2}}=149450$,$\sum_{i=1}^{20}{({x}_{i}-\overline{x})}({y}_{i}-\overline{y})=21650$.
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01);
(2)设N∈N*,变量x和变量y的一组样本数据为{(xi,yi)|i=1,2,•••,N},其中xi(i=1,2,•••,N)两两不相同,yi(i=1,2,•••,N)两两不相同.记xi在{xn|n=1,2,•••,N}中的排名是第Ri位,yi在{yn|n=1,2,•••,N}中的排名是第Si位,i=1,2,•••,N.定义变量x和变量y的“斯皮尔曼相关系数”(记为ρ)为变量x的排名和变量y的排名的样本相关系数.
(i)记di=Ri-Si,i=1,2,•••,N.证明:$ρ=1-\frac{6}{N({N}^{2}-1)}\sum_{i=1}^{N}{{d}_{i}^{2}}$;
(ii)用(i)的公式求得这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”约为0.91,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.
$r=\frac{\sum_{i=1}^{n}{({x}_{i}-\overline{x})}({y}_{i}-\overline{y})}{\sqrt{\sum_{i=1}^{n}{{({x}_{i}-\overline{x})}^{2}}\sum_{i=1}^{n}{{({y}_{i}-\overline{y})}^{2}}}}$;$\sum_{k=1}^{n}{{k}^{2}}=\frac{n(n+1)(2n+1)}{6}$;$\sqrt{6464×149450}≈31000$.

题目解答

答案

解:(1)由题意,这组学生数学成绩和知识竞赛成绩的样本相关系数为:
$r=\frac{\sum_{i}^{20}{({x}_{i}-\overline{x})({y}_{i}-\overline{y})}}{\sqrt{\sum_{i}^{20}{{({x}_{i}-\overline{x})}^{2}\sum_{i}^{20}{{({y}_{i}-\overline{y})}^{2}}}}}=\frac{21650}{\sqrt{6464×14950}}≈\frac{21650}{31000}≈0.70$;
(2)(i)证明:因为{Ri}和{Si}都是1,2,⋯,N的一个排列,
所以$\sum_{i=1}^{N}{{R}_{i}}=\sum_{i=1}^{N}{{S}_{i}}=\frac{N(N+1)}{2}$,$\sum_{i=1}^{N}{{R}_{i}^{2}}=\sum_{i=1}^{N}{{S}_{i}^{2}}=\frac{N(N+1)(2N+1)}{6}$,
从而{Ri}和{Si}的平均数都是$\bar{R}=\bar{S}=\frac{N+1}{2}$.
因此,$\sum_{i=1}^{N}{{({R}_{i}-\bar{R})}^{2}}=\sum_{i=1}^{N}{{R}_{i}^{2}}-2\bar{R}\sum_{i=1}^{N}{{R}_{i}}+\sum_{i=1}^{N}{\bar{R}^{2}}=\sum_{i=1}^{N}{{R}_{i}^{2}}-N\bar{R}^{2}$=$\frac{N(N+1)(2N+1)}{6}-\frac{N(N+1)^{2}}{4}$=$\frac{N(N+1)(N-1)}{12}$,
同理可得$\sum_{i=1}^{N}{{({S}_{i}-\bar{S})}^{2}}=\frac{N(N+1)(N-1)}{12}$,
由于$\sum_{i=1}^{N}{{d}_{i}^{2}}$=$\sum_{i=1}^{N}{{({R}_{i}-{S}_{i})}^{2}}=\sum_{i=1}^{N}{{[({R}_{i}-\bar{R})-({S}_{i}-\bar{S})]}^{2}}$=$\sum_{i=1}^{N}{{({R}_{i}-\bar{R})}^{2}}+\sum_{i=1}^{N}{{({S}_{i}-\bar{S})}^{2}}-2$
$\sum_{i=1}^{N}{({R}_{i}-\bar{R})}({S}_{i}-\bar{S})$=$2•\frac{N(N+1)(N-1)}{12}-2\sum_{i=1}^{N}{({R}_{i}-\bar{R})}({S}_{i}-\bar{S})$,
所以$ρ=\frac{\sum_{i=1}^{N}{({R}_{i}-\bar{R})}({S}_{i}-\bar{S})}{\sqrt{\sum_{i=1}^{N}{{({R}_{i}-\bar{R})}^{2}}}\sqrt{\sum_{i=1}^{N}{{({S}_{i}-\bar{S})}^{2}}}}=\frac{\frac{N(N+1)(N-1)}{12}-\frac{1}{2}\sum_{i=1}^{N}{{d}_{i}^{2}}}{\frac{N(N+1)(N-1)}{12}}=1-\frac{6}{N({N}^{2}-1)}\sum_{i=1}^{N}{{d}_{i}^{2}}$.
(ii)这组学生的数学成绩和知识竞赛成绩的斯皮尔曼相关系数是0.91,
答案①:斯皮尔曼相关系数对于异常值不太敏感,如果数据中有明显的异常值,那么用斯皮尔曼相关系数比用样本相关系数更能刻画某种线性关系;
答案②:斯皮尔曼相关系数刻画的是样本数据排名的样本相关系数,与具体的数值无关,只与排名有关.如果一组数据有异常值,但排名依然符合一定的线性关系,则可以采用斯皮尔曼相关系数刻画线性关系.

相关问题

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • 44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号