对第5章习题9的数据,逐步回归的结果只保留了3个自变量x1,x2,x5,用y对这3个自变量做岭回归分。答: 依题意,对逐步回归法所保留的三个自变量做岭回归分。程序为:include'C:Program FilesSPSSEVALRidge regression.sps'.Mult R .850373821RSquare .723135635A. dj RSqu .683583583 B. SE 2.030268037 C. table D. S MS E. Regress 3.000 226.089 75.363 F. Residual 21.000 86.562 4.122 G. value Sig F18.28313822 .00000456Variables in the Equation----------------SE(B) Beta B/SE(B)x1 .016739073 .003359156 .372627316 4.983118685x2 .156806656 .047550034 .275213878 3.297719120x3 .067110931 .032703990 .159221005 2.052071673onstant -.819486727 .754456246 .000000000 -1.086195166ND MATRIX -----由及表可知,(1)y 与x1 x2 x3 x4 的相关系数分别为0.844,0.732,0.700,0.519.(2)y对其余四个变量的线性回归方程为 .=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4) 由于.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)的系数为负,说明存在共线性,固所得的回归系数是不合理的。(3)由于条件数.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)=11.25>10,说明存在较强的共线性。(4)由上表可知由后退法和逐步回归法所得到的线性回归方程为.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4) 由于.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)的系数为负,说明仍然存在共线性。Y对其余四个自变量的岭回归如上表所示。(6)选取岭参数k=0.4,得岭回归方程.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4),回归系数都能有合理的释。/ SE(B) 得近似的t值可知,x1 x2 x3 都是显著的,所以y对x1 x2 x3的岭回归是可行的。⏺Welcome !!!欢迎您的下载,资料仅供参考!ridgereg dep=y/enter x1 x2 x5rt=0.0/stop=1/inc=0.01.岭迹如下:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)计算结果为:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)可以看到,变量x1、x2迅速由负变正,x5迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。岭迹如下:先取k=0.08:语法命令如下:Program FilesSPSSEVALRidge regression.sps'.ridgereg dep=y/enter x1 x2 x5/k=0.08.运行结果如下:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)得到回归方程为:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)再取k=0.01:语法命令如下:Program FilesSPSSEVALRidge regression.sps'.ridgereg dep=y/enter x1 x2 x5/k=0.01.运行结果:Ridge Regression with k = 0.01 ******Mult R .9931857RSquare .9864179dj RSqu .9840210SE 329.6916494tableS MSRegress 3.000 134201841 44733947Residual 17.000 1847841.9 108696.58value Sig F411.5487845 .0000000Variables in the Equation----------------SE(B) Beta B/SE(B)x1 .0556780 .0615651 .0981355 .9043751x2 .0796395 .0218437 .3291293 3.6458814x5 .1014400 .0108941 .5621088 9.3114792onstant 753.3058478 121.7381256 .0000000 6.1879205回归方程为: y=753.3058-0.05568x1-0.0796x2+0.1014x5检验,R检验,经查表,所有自变量均通过t检验,说明回归方程通过检验。从经济意义上讲,x1(农业增加值)、x2(工业增加值)x5(社会消费总额)的增加应该对y(财政收入)有正方向的影响,岭回归方程中三个自变量的系数均为正值,与实际的经济意义相符。比逐步回归法得到的方程有合理释。
散点呈直线趋势,当x增加y减小时,可初步判断两变量为( )。A. 正相关关系B. 负相关关系C. 不相关D. 还不能确定E. 非线性关系
下列属于随机误差的是()A. 砝码被腐蚀;B. 天平的两臂不等长;C. 试剂中含有微量的被测组分;D. 天平的零点有微小变动
【题目】-|||-26.阅读材料,完成下列要求。(12分)-|||-材料-|||-年份 白键桌 增ě 大随居 增长 超台交 T空长 数白 增长-|||-大分 卑 风业 串 阅项目 帛 交流-|||-(人次) (%) (人区) (%) (个数) (为) (人数) (%)-|||-1987 40 679-|||-1988 146000 80. 345 一 13 一 13-|||-1980 831800 20 一 一 一-|||-1990 800 800 66、0 一 一-|||-1901 946 (小 000 一 18 88 27 107.7-|||-1992 1 317 770 10 21.1 155 020 3307.4-|||-199 1 1.9 11 H 807 227.1 3809 29-|||-1001 180 一 17 883 30. 188 11 3 304 2. B-|||-1000 1 162 42 180 180.9 787 加、写 5 210-|||-19 1783897 13.2 65 200 14.6 97】 23、4 5 392 7. 3-|||-1007 25177376 22.1 30 -13.2 1287 29 8 707 53.7-|||-10分 2174602 2. t 78 428 38.E 1706 38. 11 463 11.6-|||-1999 2 584 64 18.3 103 977 22.6 1816 6 10 55 10.3-|||-3000 108 648 20.3 102 923 -1 1 717 -1.6 10 47 0.5-|||-2001 340 306 10、7 122 190 15.7 2915 6.1 24 719 B1.5-|||-2002 3 480 943 自 188 981 1A.7 4 384 38 230 SA-|||-2000 2 780 -25.1 124 610 -20.84 2817 25 21 189 -30.00-|||-2004 3685 250 34.9 746 S26 11. 4475 51.18 72 728 S2-|||-2000 409188 11.83 150 10. 302 31.89 3 8421 B.28-|||-2006 4 413 288 7. 807 650 29. 7243 82.7 30 981 24-|||-1007 427题 1.85 229 877 10.7 711 3.1) 41765 1.92-|||-2008 167 S9 -5.6. 218 712 21.2 8983 12.34 46 832 12.1]-|||-7000 4×8 1.06 085 200 233.03 18 348 37.79 10) 300 120.58-|||-2010 14033 14.多 1 661 879 77.61 19 089 14.14 146729 ⑫01-|||-2011 3 263 01 2.38 1844980 11.02 21 ?19 157日 143833 -1.97-|||-2018 3 1.47 2 690 212 12.56 25 842 18.01 150 872 11.10-|||-累计 18 9980012 131 139 900 173-|||-一摘编自中共中央台办、圆务院台办《历年-|||-两岸人员往来与交流统计2(2013年5月)-|||-根据材料,形成一个关于海峡两岸交流的结论,并结合所学知识予以-|||-评析。(要求:持论有据,论证充分,表达清晰,)
某指标是正态分布资料,该指标以过低为异常,用正态分布法求95%医学参考值范围,计算公式:A. overline(x) - 1.96sB. overline(x) + 1.96sC. overline(x) + 1.64sD. overline(x) - 1.64s
入冬以来,东北成为全国旅游和网络话题的"顶-|||-流".南方小土豆们纷纷北上体验东北最美的冬-|||-天,这个冬天火的不只是东北的美食,东北人的-|||-热情,还有东北的洗浴中心,南方游客直接拉着-|||-行李箱进入,拥挤程度堪比春运.东北某城市洗-|||-浴中心花式宠"且",为给顾客更好的体验,推出-|||-了A和B两个套餐服务,顾客可自由选择A和-|||-B两个套餐之一,并在App平台上推出了优惠-|||-券活动,如表是该洗浴中心在App平台10天销-|||-售优惠券的情况.-|||-日期t 1 2 3 4 5 6 7 8 9 10-|||-销售量-|||-1.90 1.98 2.20 2.36 2.43 2.59 2.68 2.76 2.70 0.40-|||-y(千张)-|||-经计算可得: hat (y)=dfrac (1)(10)sum _(i=1)^10(y)_(i)=2.2 sum _(i=1)^10(t)_(i)(y)_(i)=118.73,-|||-sum _(i=1)^10({t)_(i)}^2=385 .入冬以来,东北成为全国旅游和网络话题的"顶-|||-流".南方小土豆们纷纷北上体验东北最美的冬-|||-天,这个冬天火的不只是东北的美食,东北人的-|||-热情,还有东北的洗浴中心,南方游客直接拉着-|||-行李箱进入,拥挤程度堪比春运.东北某城市洗-|||-浴中心花式宠"且",为给顾客更好的体验,推出-|||-了A和B两个套餐服务,顾客可自由选择A和-|||-B两个套餐之一,并在App平台上推出了优惠-|||-券活动,如表是该洗浴中心在App平台10天销-|||-售优惠券的情况.-|||-日期t 1 2 3 4 5 6 7 8 9 10-|||-销售量-|||-1.90 1.98 2.20 2.36 2.43 2.59 2.68 2.76 2.70 0.40-|||-y(千张)-|||-经计算可得: hat (y)=dfrac (1)(10)sum _(i=1)^10(y)_(i)=2.2 sum _(i=1)^10(t)_(i)(y)_(i)=118.73,-|||-sum _(i=1)^10({t)_(i)}^2=385 .
19 .已知某地正常人某定量指标的总体均值 μ0=5,今随机测得该地特殊人群中的 30 人该指标的数值。若用 t 检验推断该特殊人群该指标的总体均值 μ 与μ0 之间是否有差别,则自由度为()。A. 5B. 28C. 29D. 4E. 30
4.设X为随机变量,则 D(-2X+1)=(). bigcircA.-2D(X)+1 B.-2D(X) C.-2D(X)+1 D.4D(X)
某地拟制定正常学龄前儿童血铅值99%参考值范围,若正常学龄前儿童血铅含量近似服从对数正态分布,宜采用A. X+2.58SB. Lg-1(Xlgx十2. 58Slgx)C. X+1. 96SD. lg-1 (Xlgx +2. 32Slgx)E. X+2.32S
( )也被称为任意抽样。A. 便利抽样B. 随机抽样C. 立意抽样非随机抽样D. 抽样单元
热门问题
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
5.聚类分析可以看作是一种非监督的分类。()
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁