logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

第五章 自变量选择与逐步回归5.9 初始数据:年份农业x1工业x2建筑业x3人口x4最终消费x5受灾面积x6财政收入y19781018.4 1607.0 138.2 962592239.1 507601132.3 19791258.9 1769.7 143.8 975422619.4 393701146.4 19801359.4 1996.5 195.5 987052976.1 445301159.9 19811545.6 2048.4 207.1 1000723309.1 397901175.8 19821761.6 2162.3 220.7 1016543637.9 331301212.3 19831960.8 2375.6 270.6 1030084020.5 347101367.0 19842295.5 2789.0 316.7 1043574694.5 318901642.9 19852541.6 3448.7 417.9 1058515773.0 443702004.8 19862763.9 3967.0 525.7 1075076542.0 471402122.0 19873204.3 4585.8 665.8 1093007451.2 420902199.4 19883831.0 5777.2 810.0 1110269360.1 508702357.2 19894228.0 6484.0 794.0 11270410556.5 469902664.9 19905017.0 6858.0 859.4 11433311365.2 384702937.1 19915288.6 8087.1 1015.1 11582313145.9 554703149.5 19925800.0 10284.5 1415.0 11717115952.1 513303483.4 19936882.1 14143.8 2284.7 11851720182.1 488304349.0 19949457.2 19359.6 3012.6 11985026796.0 550405218.1 199511993.0 24718.3 3819.6 12112133635.0 458216242.2 199613844.2 29082.6 4530.5 12238940003.9 469897408.0 199714211.2 32412.1 4810.6 12362643579.4 534298651.1 199814599.6 33429.8 5262.0 12481046405.9 501459876.0

第五章 自变量选择与逐步回归

5.9 初始数据:

年份

农业x1

工业x2

建筑业x3

人口x4

最终消费x5

受灾面积x6

财政收入y

1978

1018.4

1607.0

138.2

96259

2239.1

50760

1132.3

1979

1258.9

1769.7

143.8

97542

2619.4

39370

1146.4

1980

1359.4

1996.5

195.5

98705

2976.1

44530

1159.9

1981

1545.6

2048.4

207.1

100072

3309.1

39790

1175.8

1982

1761.6

2162.3

220.7

101654

3637.9

33130

1212.3

1983

1960.8

2375.6

270.6

103008

4020.5

34710

1367.0

1984

2295.5

2789.0

316.7

104357

4694.5

31890

1642.9

1985

2541.6

3448.7

417.9

105851

5773.0

44370

2004.8

1986

2763.9

3967.0

525.7

107507

6542.0

47140

2122.0

1987

3204.3

4585.8

665.8

109300

7451.2

42090

2199.4

1988

3831.0

5777.2

810.0

111026

9360.1

50870

2357.2

1989

4228.0

6484.0

794.0

112704

10556.5

46990

2664.9

1990

5017.0

6858.0

859.4

114333

11365.2

38470

2937.1

1991

5288.6

8087.1

1015.1

115823

13145.9

55470

3149.5

1992

5800.0

10284.5

1415.0

117171

15952.1

51330

3483.4

1993

6882.1

14143.8

2284.7

118517

20182.1

48830

4349.0

1994

9457.2

19359.6

3012.6

119850

26796.0

55040

5218.1

1995

11993.0

24718.3

3819.6

121121

33635.0

45821

6242.2

1996

13844.2

29082.6

4530.5

122389

40003.9

46989

7408.0

1997

14211.2

32412.1

4810.6

123626

43579.4

53429

8651.1

1998

14599.6

33429.8

5262.0

124810

46405.9

50145

9876.0

题目解答

答案

(4)两种方法得到的模型是不同的,回退法剔除了x5,保留了x6, x3, x2, x4作为最终模型。而逐步回归法只引入了x3。说明了方法对自变量重要性的认可不同的,这与自变量的相关性有关联。相比之下,后退法首先做全模型的回归,每一个变量都有机会展示自己的作用,所得结果更有说服力

解析

考查要点:本题主要考查变量选择方法(回退法与逐步回归法)的差异及其对模型结果的影响,重点在于理解两种方法在自变量筛选逻辑上的不同,以及自变量相关性对结果的作用。

核心思路:

  1. 回退法从全模型出发,逐步剔除不显著变量,允许变量间“协同作用”被保留;
  2. 逐步回归法从空模型开始,逐步引入显著变量,可能忽略因共线性而间接重要的变量;
  3. 自变量相关性是导致两种方法结果差异的关键因素。

方法对比与结果分析

回退法特点

  • 初始包含所有变量,通过检验逐步剔除对模型贡献不显著的变量。
  • x5(最终消费)可能因与其他变量(如x2工业、x4人口)高度相关,在全模型中被剔除,但其作用可能被其他变量间接体现。

逐步回归法特点

  • 从无变量开始,每次引入当前最优变量(x3建筑业),后续变量若无法显著提升模型则不引入。
  • x3单独解释力强,但可能忽略与其他变量(如x2工业)的协同作用。

关键结论

  • 自变量相关性导致两种方法对变量重要性的判断不同:
    • 回退法保留x6(受灾面积)、x3、x2、x4,说明这些变量在全模型中存在互补作用;
    • 逐步回归法仅保留x3,可能因其他变量在单独引入时解释力不足。

相关问题

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • 设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号