某厂生产一批金属材料,其抗弯强度服从正态分布。今从这批金属材料中抽取11个测试件,测得它们的抗弯强度为:42.5 42.7 43.0 42.3 43.4 44.5 44.0 43.8 44.1 43.9 43.7求:(1)平均抗弯强度μ的置信系数为0.95的置信区间;(2)抗弯强度标准差σ的置信系数为0.90的置信区间。
该题使用SPSS软件分析,结果如下:(1) 得到线性回归方程为 ⑴--0.591 • 22.386X, 327.672X。(2) 其中回归系数 弭=22.386表示的是,在温度不变的条件下,降雨量每增加 1个单位,某农场早稻收获量平均增加 22.386个单位;=327.672表示的是,在降雨量不变的条件下,温度每升高 1个单位,某农场早稻收获量平均增加 327.672个单位;-0.591并无特定实际含义。(3) F检验,提出假设, h。「1 =辽=0, H1 : '-i不全为0, i =1,2,检验统计量 F =228.44, p值<0.05的显著性水平,因此拒绝原假设,认为降雨量和温度二者对农场早 稻收获量的影响总体上是显著的。第七章思考与练习参考答案1 •答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应; 而相关关系表示的是两变量之间的一种不确定性关系, 具体表示为当一个变量取一定数值时, 与之相对应的另一变量的数值虽然不确定, 但它仍按某种规律在定的范围内变化。2•答:相关和回归都是研究现象及变量之间相互关系的方法。相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式, 也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式, 并可变量之间的数量联系进行测定, 确定一个回归方程,并根据这个回归方程从已知量推测未知量。样本相关系数。有相关系数是多元线性回归分3•答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数 R2的正的平方根。偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间 真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。4.答:回归模型假定总体上因变量 Y与自变量X之间存在着近似的线性函数关系,可表示为Y^ 1 1X t ut,这就是总体回归函数,其中 ut是随机误差项,可以反映未考虑的其他各种因素对 Y的影响。根据样本数据拟合的方程, 就是样本回归函数, 以一元线性回归模型的样本回归函数为例可表示为: Y?=耳+弭xt。总体回归函数事实上是未知的,需要利用样本的信息对其进行估计, 样本回归函数是对总体回归函数的近似反映。 两者的区别主要包括: 第一,总体回归直线是未知的,它只有一条; 而样本回归直线则是根据样本数据拟合的,每抽取一组样本, 便可以拟合一条样本回归直线。第二, 总体回归函数中的-0和-1是未知的参数,表现为常数;而样本回归直线中的 '?Q和?i是随机变量,其具体数值随所抽取的样本观测值不同而变动。5•最小二乘法是在根据样本数据估计样本回归方程时,采用残差平方和作为衡量总偏 差的尺度,找到使得残差平方和最小的回归系数 児和网的取值的估计方法。根据微积分中求极小值的原理,可知欲使残差平方和 Q达到最小,Q对氐和席的偏导数必须等于零。6.答:总离差平方和是因变量的实际观测值和样本均值的离差平方和;回归平方和是因变量的理论回归值与样本均值的离差平方和; 残差平方和是实际观测值与理论回归值的离差平方和。三者之间的关系是:总离差平方和 =回归平方和+残差平方和。7.答:判定系数 R2是回归平方和占总离差平方和的比例,它是对估计的回归模型拟合程度的度量。它可以解释为:在因变量的离差中,可以由自变量所解释的部分。 R2越接近于1,表明回归平方和占总离差平方和的比例越大,回归直线与各观测点越接近,回归直线的拟合程度就越好;反之, R2越接近于0,回归直线的拟合程度就越差。&答:一元回归模型中,估计标准误差是对各观测数据在回归直线周围分散程度的一 种度量值,它是对随机误差项Ut的标准差二的估计。它反映了用样本回归方程估计因变量 丫时平均误差的大小。9•答:在多元线性回归方程中, F检验是对回归方程整体显著性的检验,其原假设为所有回归系数全部为零, 即只要其中有一个自变量的回归系数不显著为零, 其F检验就能通过,即该方程整体上是显著的。但是这并不意味着每个自变量与因变量的关系都显著。而 t检验是对每个回归系数的显著性单独进行检验, 它主要用于检验每个自变量对因变量的影响是否显著非零。10.答:在一元线性回归模型中, 不同的模型都仅包含一个自变量, 如果使用的样本容量也一样,判定系数便可以直接作为评价拟合程度的尺度。 然而在多元线性回归模型中,不同模型所包含的自变量个数未必相同, 如果在模型中额外增加一个自变量, 即使这个自变量2没有经济意义,在统计上也不显著, R仍可能会变大,至少不会下降,因此为了避免增加2自变量而高估 R,需要对多元线性回归方程的判定系数进行修正,其计算公式为: n TRa = 1 _ (1 _ R ) ■-n — p T11•答:(1)人均GDP与人均消费水平的散点图如下:地区人均国内 生产总值X (元)人均消 费水平(元)X2Y2XY北京460732650445160053670276164541960辽宁1122644901260230762016010050404740上海34547115461193495209133310116398879662江西4851239623532201574081611622996河南5444220829637136487526412020352贵州26621608708624425856644280496陕西454920352069340141412259257215合计85739316091904918867224483461651007421人均消费水平之间的线性相关系数35475CS5 D:>.91750744=3恥。(3)已知 n = 7, ' X = 85739, ' 丫 = 31609, ' X2 = 1904918867 , ' XY =样本相关系数。有相关系数是多元线性回归分样本相关系数。有相关系数是多元线性回归分样本相关系数。有相关系数是多元线性回归分—--— 。估计的一元线性回归方程为: 丫?二734.693 0.309X。其中,0.309表示人均国内生 产总值每增加1元,人均消费水平平均增加 0.309元;734.693表示与人均国内生产总值无 关的人均消费水平平均为 734.693元。Ssr 5" (Y? _ y )2 5" (y_ Y?)2(4)根据判定系数公式 R2 =旦“ 2 =1 ! 2计算可得,SST Z (Yt —Y) 送(¥ — Y)'二-…二;。S135i7M其意义为,在人均消费水平的离差中, 有99.6%可以由人均消费水平与人均 GDP之间的线性回归方程来解释,该方程的拟合程度较好。(5)样本相关系数。有相关系数是多元线性回归分第1步:提出假设Ho: ! =0,即两个变量之间的线性关系不显著。Hi: -0,即两个变量之间的线性关系显著。第2步:计算检验统计量根据公式F SSR/1 MSR计算可得,匚二二…… 二SSE/( n —2) MSE ^5795^-2)第3步:做出决策在a= 0.05的显著性水平下,查 F分布表(分子自由度为1、分母自由度为5),得到临 界值F a= 6.61。由于F>Fa,因此拒绝H0,即两个变量之间的线性关系是显著的。(6) 根据回归方程计算可得,辛二7刃.f 冰 f 旳 站 即预测该地 区人均消费水平平均为 2279.693元。12.答:卩啤酒 品牌广告费X(万兀)销售量 Y (万箱)X2Y2XYA120.036.314400.001317.694356.00B68.720.74719.69428.491422.09C100.115.910020.01252.811591.59D76.613.25867.56174.241011.12E8.78.175.6965.6170.47F1.07.11.0050.417.10G21.55.6462.2531.36120.40H1.44.41.9619.366.16I5.34.428.0919.3623.32J120.036.32.8918.497.31合计40512035579.142377.828615.562已知 n = 10, ' x = 405, ' Y = 120, ' X = 35579.14 , ' XY = 8615.56,因此根据公式7-9计算可得,一 * 一, • 二一 「’— 。估计的一元线性回归方程为: Y?二4.062 0.196X。13•答:(1)表7-11不同广告费用的方差分析表方差来源dfSSMSFSigni fica nee F回归11602708.601602708.60399.102.17E-09
比较健康人群收缩压和舒张压的变异水平,应采用的指标A. 方差B. 总体标准差C. 变异系数D. 四分位数间距E. 中位数
设X1,X2,···,Xn, _(n+1) 是来自正态总体N(μ,σ ^2)的样本,设X1,X2,···,Xn, _(n+1) 是来自正态总体N(μ,σ ^2)的样本,设X1,X2,···,Xn, _(n+1) 是来自正态总体N(μ,σ ^2)的样本,设X1,X2,···,Xn, _(n+1) 是来自正态总体N(μ,σ ^2)的样本,设X1,X2,···,Xn, _(n+1) 是来自正态总体N(μ,σ ^2)的样本,设X1,X2,···,Xn, _(n+1) 是来自正态总体N(μ,σ ^2)的样本,
偏倚是一种()。A. 偶然误差B. 抽样误差C. 系统误差D. 随机测量误差E. 以上都不是
Levey-Jennings质控图的优点是:( )A. 简便易行,在均值和标准差已知后,它允许直接在图上画出单个质控测 定值B. 没有假失控率C. 对误差识别特异性高D. 是最精确的质控方法
调查得到100人的血压值资料,根据研究目的,该资料可以整理为( )A. 计量资料B. 计数资料C. 等级资料D. 可以是A也可以是BE. A、B、C都有可能
对于任意两个随机变量X和Y,若E(XY)=E(X).E(Y),则( ).A. D(XY)=D(X).D(y)B. D(X+y)=D(X)+D(Y)C. X和Y独立D. X和Y不独立
下面随机试验样本空间表示错误的是()A.抛硬币试验A.[正面,反面]。A.观察城市一个月内交通事故发生的次数A..A.明天是否下雨A.[是,否]。A.某种型号鼠标的使用寿命A..
4.设总体 sim N(mu ,(5)^2)-|||-(1)从总体中抽取容量为64的样本,求样本均值X与总体均值之差的绝对值小于1的概-|||-率 (|overline (X)-mu |lt 1);-|||-(2)抽取样本容量n多大时,才能使概率 (|overline (X)-mu |lt 1) 达到0.95?
热门问题
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
5.聚类分析可以看作是一种非监督的分类。()
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100