logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

对第5章习题9的数据,逐步回归的结果只保留了3个自变量x1,x2,x5,用y对这3个自变量做岭回归分。答: 依题意,对逐步回归法所保留的三个自变量做岭回归分。程序为:include'C:Program FilesSPSSEVALRidge regression.sps'.Mult R .850373821RSquare .723135635A. dj RSqu .683583583 B. SE 2.030268037 C. table D. S MS E. Regress 3.000 226.089 75.363 F. Residual 21.000 86.562 4.122 G. value Sig F18.28313822 .00000456Variables in the Equation----------------SE(B) Beta B/SE(B)x1 .016739073 .003359156 .372627316 4.983118685x2 .156806656 .047550034 .275213878 3.297719120x3 .067110931 .032703990 .159221005 2.052071673onstant -.819486727 .754456246 .000000000 -1.086195166ND MATRIX -----由及表可知,(1)y 与x1 x2 x3 x4 的相关系数分别为0.844,0.732,0.700,0.519.(2)y对其余四个变量的线性回归方程为 .=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4) 由于.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)的系数为负,说明存在共线性,固所得的回归系数是不合理的。(3)由于条件数.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)=11.25>10,说明存在较强的共线性。(4)由上表可知由后退法和逐步回归法所得到的线性回归方程为.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4) 由于.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)的系数为负,说明仍然存在共线性。Y对其余四个自变量的岭回归如上表所示。(6)选取岭参数k=0.4,得岭回归方程.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4),回归系数都能有合理的释。/ SE(B) 得近似的t值可知,x1 x2 x3 都是显著的,所以y对x1 x2 x3的岭回归是可行的。⏺Welcome !!!欢迎您的下载,资料仅供参考!ridgereg dep=y/enter x1 x2 x5rt=0.0/stop=1/inc=0.01.岭迹如下:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)计算结果为:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)可以看到,变量x1、x2迅速由负变正,x5迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。岭迹如下:先取k=0.08:语法命令如下:Program FilesSPSSEVALRidge regression.sps'.ridgereg dep=y/enter x1 x2 x5/k=0.08.运行结果如下:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)得到回归方程为:.=1.002+0.4000+0.148(x)_(2)+0.015x-0.029(x)_(4)再取k=0.01:语法命令如下:Program FilesSPSSEVALRidge regression.sps'.ridgereg dep=y/enter x1 x2 x5/k=0.01.运行结果:Ridge Regression with k = 0.01 ******Mult R .9931857RSquare .9864179dj RSqu .9840210SE 329.6916494tableS MSRegress 3.000 134201841 44733947Residual 17.000 1847841.9 108696.58value Sig F411.5487845 .0000000Variables in the Equation----------------SE(B) Beta B/SE(B)x1 .0556780 .0615651 .0981355 .9043751x2 .0796395 .0218437 .3291293 3.6458814x5 .1014400 .0108941 .5621088 9.3114792onstant 753.3058478 121.7381256 .0000000 6.1879205回归方程为: y=753.3058-0.05568x1-0.0796x2+0.1014x5检验,R检验,经查表,所有自变量均通过t检验,说明回归方程通过检验。从经济意义上讲,x1(农业增加值)、x2(工业增加值)x5(社会消费总额)的增加应该对y(财政收入)有正方向的影响,岭回归方程中三个自变量的系数均为正值,与实际的经济意义相符。比逐步回归法得到的方程有合理释。

对第5章习题9的数据,逐步回归的结果只保留了3个自变量x1,x2,x5,用y对这3个自变量做岭回归分。

答: 依题意,对逐步回归法所保留的三个自变量做岭回归分。

程序为:

include'C:\Program Files\SPSSEVAL\Ridge regression.sps'.

Mult R .850373821

RSquare .723135635

A. dj RSqu .683583583
B. SE 2.030268037
C. table
D. S MS
E. Regress 3.000 226.089 75.363
F. Residual 21.000 86.562 4.122
G. value Sig F
18.28313822 .00000456
Variables in the Equation----------------
SE(B) Beta B/SE(B)
x1 .016739073 .003359156 .372627316 4.983118685
x2 .156806656 .047550034 .275213878 3.297719120
x3 .067110931 .032703990 .159221005 2.052071673
onstant -.819486727 .754456246 .000000000 -1.086195166
ND MATRIX -----
由及表可知,
(1)y 与x1 x2 x3 x4 的相关系数分别为0.844,0.732,0.700,0.519.
(2)y对其余四个变量的线性回归方程为 由于的系数为负,说明存在共线性,固所得的回归系数是不合理的。
(3)由于条件数=11.25>10,说明存在较强的共线性。
(4)由上表可知由后退法和逐步回归法所得到的线性回归方程为 由于的系数为负,说明仍然存在共线性。
Y对其余四个自变量的岭回归如上表所示。
(6)选取岭参数k=0.4,得岭回归方程,回归系数都能有合理的释。
/ SE(B) 得近似的t值可知,x1 x2 x3 都是显著的,所以y对x1 x2 x3的岭回归是可行的。
⏺
Welcome !!!
欢迎您的下载,
资料仅供参考!
ridgereg dep=y/enter x1 x2 x5
rt=0.0/stop=1/inc=0.01.
岭迹如下:

计算结果为:

可以看到,变量x1、x2迅速由负变正,x5迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。岭迹如下:
先取k=0.08:
语法命令如下:
\Program Files\SPSSEVAL\Ridge regression.sps'.
ridgereg dep=y/enter x1 x2 x5
/k=0.08.
运行结果如下:

得到回归方程为:

再取k=0.01:
语法命令如下:
\Program Files\SPSSEVAL\Ridge regression.sps'.
ridgereg dep=y/enter x1 x2 x5
/k=0.01.
运行结果:
Ridge Regression with k = 0.01 ******
Mult R .9931857
RSquare .9864179
dj RSqu .9840210
SE 329.6916494
table
S MS
Regress 3.000 134201841 44733947
Residual 17.000 1847841.9 108696.58
value Sig F
411.5487845 .0000000
Variables in the Equation----------------
SE(B) Beta B/SE(B)
x1 .0556780 .0615651 .0981355 .9043751
x2 .0796395 .0218437 .3291293 3.6458814
x5 .1014400 .0108941 .5621088 9.3114792
onstant 753.3058478 121.7381256 .0000000 6.1879205
回归方程为: y=753.3058-0.05568x1-0.0796x2+0.1014x5
检验,R检验,经查表,所有自变量均通过t检验,说明回归方程通过检验。
从经济意义上讲,x1(农业增加值)、x2(工业增加值)x5(社会消费总额)的增加应该对y(财政收入)有正方向的影响,岭回归方程中三个自变量的系数均为正值,与实际的经济意义相符。比逐步回归法得到的方程有合理释。

题目解答

答案

Adj RSqu .683583583 SE 2.030268037 ANOVA table df SS MS Regress 3.000 226.089 75.363 Residual 21.000 86.562 4.122 F value Sig F 18.28313822 .00000456 --------------Variables in the Equation---------------- B SE(B) Beta B/SE(B) x1 .016739073 .003359156 .372627316 4.983118685 x2 .156806656 .047550034 .275213878 3.297719120 x3 .067110931 .032703990 .159221005 2.052071673 Constant -.819486727 .754456246 .000000000 -1.086195166 ------ END MATRIX ----- 由及表可知, (1)y 与x1 x2 x3 x4 的相关系数分别为0.844,0.732,0.700,0.519. y对其余四个变量的线性回归方程为 word/media/image16_1.png 由于 word/media/image17_1.png 的系数为负,说明存在共线性,固所得的回归系数是不合理的。 由于条件数 word/media/image18_1.png =11.25>10,说明存在较强的共线性。 由上表可知由后退法和逐步回归法所得到的线性回归方程为 word/media/image19_1.png 由于 word/media/image17_1.png 的系数为负,说明仍然存在共线性。 Y对其余四个自变量的岭回归如上表所示。 选取岭参数k=0.4,得岭回归方程 word/media/image20_1.png ,回归系数都能有合理的释。 用y对x1 x2 x3 做岭回归,选取岭参数k=0.4,岭回归方程为 word/media/image21_1.png 回归系数都能有合理的释,由 B / SE(B) 得近似的t值可知,x1 x2 x3 都是显著的,所以y对x1 x2 x3的岭回归是可行的。 Welcome !!! 欢迎您的下载, 资料仅供参考! ridgereg dep=y/enter x1 x2 x5 /start=0.0/stop= 1 /inc=0.01. 岭迹如下: word/media/image3_1.png 计算结果为: word/media/image4.png 可以看到,变量x 1 、x 2 迅速由负变正,x 5 迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。岭迹如下: 先取 k=0.0 8: 语法命令如下: include'C:\Program Files\SPSSEVAL\Ridge regression.sps'. ridgereg dep=y/enter x1 x2 x5 /k=0.08. 运行结果如下: word/media/image5.png 得到回归方程为: 再取 k=0.0 1: 语法命令如下: include'C:\Program Files\SPSSEVAL\Ridge regression.sps'. ridgereg dep=y/enter x1 x2 x5 /k=0.0 1 . 运行结果: ****** Ridge Regression with k = 0.01 ****** Mult R .9931857 RSquare .9864179 Adj RSqu .9840210 SE 329.6916494 ANOVA table df SS MS Regress 3.000 134201841 44733947 Residual 17.000 1847841.9 108696.58 F value Sig F 411.5487845 .0000000 --------------Variables in the Equation---------------- B SE(B) Beta B/SE(B) x1 .0556780 .0615651 .0981355 .9043751 x2 .0796395 .0218437 .3291293 3.6458814 x5 .1014400 .0108941 .5621088 9.3114792 Constant 753.3058478 121.7381256 .0000000 6.1879205 回归方程为: y=753.3058-0.05568x1-0.0796x2+0.1014x5 从上表可看出,方程通过F检验,R检验,经查表,所有自变量均通过t检验,说明回归方程通过检验。 从经济意义上讲,x 1 (农业增加值)、x 2 (工业增加值) x 5 (社会消费总额) 的增加应该对y(财政收入)有正方向的影响,岭回归方程中三个自变量的系数均为正值,与实际的经济意义相符。比逐步回归法得到的方程有合理释。

相关问题

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • 设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • 44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号