1.电工器材厂生成一批保险丝,已知其熔化时间(单位:min)服从正态分布N(mu,sigma^2),现从该批保险丝中取16根进行测试,计算得平均熔化时间为62.4,标准差为11。问在显著性水平alpha=0.05时,是否可以认为整批保险丝的熔化时间的方差为80?
某医院治疗病人的疗效分级(痊愈、好转、无效、死亡)属于的变量类型是()A. 定量资料B. 定性资料C. 等级资料D. 分组资料E. 间断性资料
14 填空 (2分) 若随机变量X_(1),...,X_(n)相互独立,且X_(i)sim U(-3,3),则(1)/(sqrt(3n))sum_(i=1)^nX_(i)近似服从分布____.
One-SamplesTTest过程可以用于()。A. 一个总体比例的检验B. 一个总体方差的检验C. 一个总体均值的检验D. 一个总体均值的区间估计
在总体分布未知或所知甚少的情况下,利用样本数据对总体分布形态等进行推导,是一种参数检验方法;
若_(1),... ,(X)_(2),... 独立同分布,且_(1),... ,(X)_(2),... ,_(1),... ,(X)_(2),... 为标准正态分布的分布函数,则下列表述正确的是().A._(1),... ,(X)_(2),... B._(1),... ,(X)_(2),... C._(1),... ,(X)_(2),... D._(1),... ,(X)_(2),...
若D(X) =4,D(Y) =9, rho xY=0.5,Z=2 X-3 Y+5,则D(Z) =_______.
第七章练习题选择题7.1.在线性回归模型._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)中,._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)反映的是( )A. X变动一个单位时Y的实际变动量 B. 由于Y的变化引起的X的线性变化部分 C. X变动一个单位时Y的平均变动量 D. Y变动一个单位时X的平均变动量 E. ) F. 7.2在回归模型._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)中,._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)反映的是( ) G. 由于x的变化引起的Y的线性变化部分由于Y的变化引起的X的线性变化部分除了X和Y的线性关系之外的其他因素对Y的影响由于X和Y的线性关系对Y的影响)7.3在用普通最小二乘法估计模型中参数时,要求模型满足一些基本假定,根本原因是( )为了使回归方程更为简化,便于计算模型参数的估计值为了便于确定所估计参数的均值为了使估计的参数具有良好的统计性质,得出最佳线性无偏估计。为了使因变量更容易控制,保证因变量和自变量有稳定的相关性)7.4在多元线性回归中,计算了可决系数后还要计算修正的可决系数,这是为了( )可决系数的计算不很准确,需要加以修正。便于比较自变量个数不同的模型的拟合程度。为了使其与F检验结论一致。为了不损失模型的自由度。)7.5利用回归模型作区间预测时, 因变量的预测区间的宽度( )。随自变量X 的值增大而增大随自变量X 的值增大而缩小在._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)处最小在._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i) 处最大)判断题7.1样本容量为n=35,作两个回归模型:模型1:._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i),可决系数为._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)0.8850;模型2:._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i),可决系数为._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)0.9012。因为模型2的可决系数大于模型1 ,所以模型2比模型1的拟合优度更好。判断:( )参考答:判断:(错)原因:由于在样本容量一定的条件下,总离差平方和与自变量的个数无关,而残差平方和会随着模型中自变量个数的增加而减少,至少不会增加。也就是说,随着模型中自变量的增加,多重可决系数._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)会随着自变量个数增加而增大。因此,多元线性回归模型中,在比较因变量相同而自变量个数不同的模型的拟合程度时,不能简单地对比多重可决系数。在样本容量一定的情况下,增加自变量必定使得待估参数的个数增加,从而损失自由度;而且在实际应用中,有时所增加的自变量并非必要。为此,需要用自由度去修正多重可决系数._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)中的残差平方和与回归平方和,引入修正的可决系数。7.2在回归模型参数估计方法的基本假定中,涉及对随机误差项._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)分布性质的假定,但是随机误差项._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)是未知的,在具体作回归分时不必考虑其分布。判断:( )参考答:判断:( 错 )原因: ①只有具备一定的假定条件,对模型所作出的估计才可能具有良好的统计性质,所估计的参数才能"尽可能地接近"(即"尽可能准确地估计")参数的真实值。在普通最小二乘估计的统计性质的证明中,基本假定中关于随机误差项._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)的分布性质是必备的条件。也就是说如果基本假定不成立,参数估计的无偏性、有效性或者一致性也就不一定成立。通过对高斯定理的数学证明能深刻体会到。②因为模型中有随机扰动项,所估计的参数也是随机变量,显然参数估计量的分布与随机扰动项的分布有关,只有对随机扰动项的分布作出某些假定,才能比较方便地确定参数估计量的分布性质,才可能在此基础上去对参数进行假设检验和区间估计等统计推断,也才可能对因变量作区间预测。7.3回归模型参数估计方法的基本假定主要应用于数学证明,在具体作回归分时不必考虑基本假定。判断:( )参考答:判断:( 错 )原因: ①只有具备一定的假定条件,对模型所作出的估计才可能具有良好的统计性质。所估计的参数才能"尽可能地接近"(即"尽可能准确地估计")参数的真实值。在普通最小二乘估计的统计性质的证明中,基本假定是必备的条件。也就是说如果基本假定不成立,参数估计的无偏性、有效性或者一致性也就不一定成立。通过对高斯定理的数学证明能深刻体会到。②因为模型中有随机扰动项,所估计的参数也是随机变量,显然参数估计量的分布与随机扰动项的分布有关,只有对随机扰动项的分布作出某些假定,才能比较方便地确定参数估计量的分布性质,才可能在此基础上去对参数进行假设检验和区间估计等统计推断,也才可能对因变量作区间预测。Y作区间预测,可以得到可靠的预测结果。判断:( )参考答:判断(错)原因:利用回归模型对自变量的预测区间不是常数。预测区间的上下限与以下因素有关:因为预测区间是 ._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)①样本容量n越小,预测区间将越大,②样本容量越小,._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)也越小,预测区间则越大;③随._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)的变化而变化,当._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)时,预测区间最小,随着._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)对._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)的愈加偏离,预测区间将愈宽。本例中,2000年—2010年样本容量为n=11;._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)=6,预测期2020年的序号21,._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)=21-6=15。本例中样本容量较小,预测区间较大;此外,本例的预测期偏离样本期的._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)过远,._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)较大,此时预测区间将会很宽,预测的可靠性会非常低。检验与t 检验是两种完全不同的检验,在一元回归分._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)中,对模型的F检验已得到F=155.11,P值为3.66E-13,为了检验自变量._(i)=(P)_(1)+(P)_(2)(X)_(i)+(C)_(i)的显著性,还必须作t检验。判断( )参考答案:判断(错)检验。事实上,在一元回归情形下容易证明F=t2,F检验与t检验是等价的。所以已经有F检验显著的结论,就不是必须再作t 检验。7.6 一项对多个国家心脏病死亡率与市场葡萄酒销售量回归分的研究表明,市场葡萄酒销售量上升有助于降低心脏病死亡率,这就是说每个人只要多喝葡萄酒就都会降低心脏病死亡的风险。判断( )参考答案:判断(错)原因:回归分的本质是关于一个变量(因变量)对另一个或另外多个变量(自变量)依存关系的研究,是用适当的回归模型去近似地表达或估计变量之间的平均变化关系,也就是要根据自变量的固定值去估计和预测因变量的平均值。虽然从平均意义上说,市场葡萄酒销售量上升有利于有助于降低心脏病死亡率,但是并不是对每个个人都是这样。
设总体 X 的分布函数为 F(x),X_1, X_2 为其样本,又 Y = maxX_1, X_2,则 Y 的分布函数 F_Y(y)= ()A. F^2(y)B. [1 - F(y)]^2C. 1 - F^2(y)D. 1 - F(y)
若随机变量X与Y相互独立且服从同一分布,若令,则U=X+Y,V=X-Y,则U与V_。(相关或不相关)
热门问题
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
5.聚类分析可以看作是一种非监督的分类。()
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100