设随机变量X和Y都服从正态分布,则( )。A. X^2 + Y^2 服从卡方分布B. X+Y服从正态分布C. X^2 和 Y^2 都服从卡方分布D. (X^2)/(Y^2) 服从F分布
对第5章习题9的数据,逐步回归的结果只保留了3个自变量x1,x2,x5,用y对这3个自变量做岭回归分。答: 依题意,对逐步回归法所保留的三个自变量做岭回归分。程序为:include'C:Program FilesSPSSEVALRidge regression.sps'.Mult R .850373821RSquare .723135635A. dj RSqu .683583583 B. SE 2.030268037 C. table D. S MS E. Regress 3.000 226.089 75.363 F. Residual 21.000 86.562 4.122 G. value Sig F18.28313822 .00000456Variables in the Equation----------------SE(B) Beta B/SE(B)x1 .016739073 .003359156 .372627316 4.983118685x2 .156806656 .047550034 .275213878 3.297719120x3 .067110931 .032703990 .159221005 2.052071673onstant -.819486727 .754456246 .000000000 -1.086195166ND MATRIX -----由及表可知,(1)y 与x1 x2 x3 x4 的相关系数分别为0.844,0.732,0.700,0.519.(2)y对其余四个变量的线性回归方程为 .=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4) 由于.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)的系数为负,说明存在共线性,固所得的回归系数是不合理的。(3)由于条件数.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)=11.25>10,说明存在较强的共线性。(4)由上表可知由后退法和逐步回归法所得到的线性回归方程为.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4) 由于.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)的系数为负,说明仍然存在共线性。Y对其余四个自变量的岭回归如上表所示。(6)选取岭参数k=0.4,得岭回归方程.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4),回归系数都能有合理的释。/ SE(B) 得近似的t值可知,x1 x2 x3 都是显著的,所以y对x1 x2 x3的岭回归是可行的。⏺Welcome !!!欢迎您的下载,资料仅供参考!ridgereg dep=y/enter x1 x2 x5rt=0.0/stop=1/inc=0.01.岭迹如下:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)计算结果为:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)可以看到,变量x1、x2迅速由负变正,x5迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。岭迹如下:先取k=0.08:语法命令如下:Program FilesSPSSEVALRidge regression.sps'.ridgereg dep=y/enter x1 x2 x5/k=0.08.运行结果如下:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)得到回归方程为:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)再取k=0.01:语法命令如下:Program FilesSPSSEVALRidge regression.sps'.ridgereg dep=y/enter x1 x2 x5/k=0.01.运行结果:Ridge Regression with k = 0.01 ******Mult R .9931857RSquare .9864179dj RSqu .9840210SE 329.6916494tableS MSRegress 3.000 134201841 44733947Residual 17.000 1847841.9 108696.58value Sig F411.5487845 .0000000Variables in the Equation----------------SE(B) Beta B/SE(B)x1 .0556780 .0615651 .0981355 .9043751x2 .0796395 .0218437 .3291293 3.6458814x5 .1014400 .0108941 .5621088 9.3114792onstant 753.3058478 121.7381256 .0000000 6.1879205回归方程为: y=753.3058-0.05568x1-0.0796x2+0.1014x5检验,R检验,经查表,所有自变量均通过t检验,说明回归方程通过检验。从经济意义上讲,x1(农业增加值)、x2(工业增加值)x5(社会消费总额)的增加应该对y(财政收入)有正方向的影响,岭回归方程中三个自变量的系数均为正值,与实际的经济意义相符。比逐步回归法得到的方程有合理释。
某地抽查25~29岁健康男子156人,测得其红细胞均数为4.65×1012/L,及同年龄段的健康女子74人,红细胞均数为4.22×1012/L,问该人群男女红细胞均数有无差别,宜用()A. 两小样本均数比较的t检验B. 两大样本均数比较的μ检验C. 配对计量资料比较的t检验D. 两个几何均数比较的t检验E. t′检验
4.设X1,.,Xn为正态总体 sim N(mu ,(sigma )^2) 的样本,记 ^2=dfrac (1)(n-1)sum _(i=1)^n(({X)_(i)-overline (X))}^2 ,则下列-|||-选项中正确的是 () .-|||-A. dfrac ((n-1){S)^2}({sigma )^2}sim (chi )^2(n-1) B. dfrac ((n-1){S)^2}({sigma )^2}sim (chi )^2(n)-|||-C. (n-1)(S)^2sim (chi )^2(n-1) D. dfrac ({S)^2}({sigma )^2}sim (chi )^2(n-1) .
已知正态总体中是已知参数,是未知参数,是来自总体的简单随机本,证明 为的无偏估计量。
2011年我国网上购物保持高速发展态势,全年网购总额达到8090亿元,比2010年增长72.90 %,占到了全国社-|||-会商品零售总额的4.46%;网购人数达到2.12亿,比2010年增长14.59 %,占到2011年全部网民数的41.50%,-|||-比2010年提高了0.9个百分点。某调查机构选取4大区域中最具代表性的30个城市为目标调查地,调查数据显-|||-示,2011年这30个城市共有8626万个网购消费者,网购总额占到当年全国网购总额的44.67%。服装是网上购-|||-买人数和购买金额均最多的商品类别。2011年中国服装网购市场总额为全年网购总额的33.00%,年增长率高于-|||-总体网购市场增长率20.60个百分点。-|||-2011年四大区域中购物网站的市场份额(%)-|||-抽样城市归类及个数 A.网站 B网站 C网站 D网站 E网站 F网站 其他-|||-京沪藕深(4个) 58.1 9.8 3.4 2.2 3.2 2.9 20.4-|||-东部城市(14个) 75.2 3.5 3.5 1.6 1.5 1.2 13.5-|||-中部城市(8个) 71.7 4.8 3.1 1.9 1.8 1.8 14.9-|||-西部城市(4个) 72.3 4.5 3.9 2.4 1.2 1.7 14-|||-全部城市(30个) 68.1 5.4 3.5 1.9 1.9 1.7 17.5-|||-116 2011年中国服装网购总额年增长率为:-|||-A、14.59% B、41.5% C、72.9% D、93.5%-|||-117 2010年我国人均网购金额约为:-|||-A、2000元 B、2500元 C、3800元 D、4200元-|||-118 2011年上述表格所列的购物网站中,在西部城市市场份额高于其在抽样市场平均份额的有:-|||-A、1个 B、2个 C、3个 D、4个-|||-119 2011年上述表格所列的购物网站中,有2个以上区域市场化比其抽样市场平均份额高1个百分点的是:-|||-A、A网站 B、B网站 C、C网站 D、D网站-|||-120 从上述资料不能推出的是:-|||-A、2011年全国网民人数 B、2010年中国服装网购市场份额-|||-C、2011年四大区域以外网民的人均网购金额-|||-D、2010年A网站在30个目标城市中所占的市场份额
例6.2 随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,求该地正常成年男子脉搏总体均数95%的置信区间。 本例自由度ν=25-1=24,经查表(附表2)得t_(0.05/2,24)=2.064,则: overline(x)-t_(0.05/2,24)s_(overline{x)}=73.6-2.064times6.5/sqrt(25)=70.9(次/分) overline(x)+t_(0.05/2,24)s_(overline{x)}=73.6+2.064times6.5/sqrt(25)=76.3(次/分) 即该地正常成年男子脉搏总体均数的95%置信区间为(70.9,76.3)次/分。
反映一组血清抗体资料的平均水平,常选用的指标是()A. 均数B. 中位数C. 几何均数D. 变异系数E. 极差
19 .已知某地正常人某定量指标的总体均值 μ0=5,今随机测得该地特殊人群中的 30 人该指标的数值。若用 t 检验推断该特殊人群该指标的总体均值 μ 与μ0 之间是否有差别,则自由度为()。A. 5B. 28C. 29D. 4E. 30
某指标是正态分布资料,该指标以过低为异常,用正态分布法求95%医学参考值范围,计算公式:A. overline(x) - 1.96sB. overline(x) + 1.96sC. overline(x) + 1.64sD. overline(x) - 1.64s
热门问题
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
5.聚类分析可以看作是一种非监督的分类。()
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)