logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

第二章思考题与练习题思考题2.1相关分析与回归分析的关系是什么?2.2什么是总体回归函数和样本回归函数?它们之间的区别是什么?2.3什么是随机扰动项和剩余项(残差)?它们之间的区别是什么?2.4为什么在对参数作最小二乘估计之前,要对模型提出古典假定?2.5总体方差和参数估计方差的区别是什么?2.6为什么可决系数可以度量模型的拟合优度?在简单线性回归中它与对参数的t检验的关系是什么?2.7有人说:“得到参数区间估计的上下限后,说明参数的真实值落入这个区间的概率为”,如何评论这种说法?2.8对参数假设检验的基本思想是什么?2.9为什么对被解释变量个别值的预测区间会比对被解释变量平均值的预测区间更宽?2.10如果有人利用中国1978年—2000年的样本估计的计量经济模型直接预测:“中国综合经济水平将在2050年达到美国2002年的水平”,你如何评论这种预测?2.11对本章开始提出的”中国旅游业总收入将超过3000亿美元?”,你认为可以建立什么样的简单线性回归模型去分析?练习题2.1为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:资料来源:《深圳统计年鉴2002》,中国统计出版社(1)建立深圳地方预算内财政收入对GDP的回归模型;请考虑下列模型:(1)利用表中数据估计此模型的参数。(2)你认为数据中有多重共线性吗?(3)进行以下回归:根据这些回归你能对数据中多重共线性的性质说些什么?(4)假设数据有多重共线性,但在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?________________4.4自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?4.5克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:(括号中的数据为相应参数估计量的标准误)。试对上述模型进行评析,指出其中存在的问题。________________4.6理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计数据,具体如下:资料来源:《中国统计年鉴》2004、2000年版,中国统计出版社。要求:(1)建立对数线性多元回归模型(2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?(3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。4.7在本章开始的“引子”提出的“农业和建筑业的发展会减少财政收入吗?”的例子中,如果所采用的数据如下表所示1978-2003年财政收入及其影响因素数据 ________________

第二章思考题与练习题

思考题

2.1相关分析与回归分析的关系是什么?

2.2什么是总体回归函数和样本回归函数?它们之间的区别是什么?

2.3什么是随机扰动项和剩余项(残差)?它们之间的区别是什么?

2.4为什么在对参数作最小二乘估计之前,要对模型提出古典假定?

2.5总体方差和参数估计方差的区别是什么?

2.6为什么可决系数可以度量模型的拟合优度?在简单线性回归中它与对参数的t检验的关系是什么?

2.7有人说:“得到参数区间估计的上下限后,说明参数的真实值落入这个区间的概率为”,如何评论这种说法?

2.8对参数假设检验的基本思想是什么?

2.9为什么对被解释变量个别值的预测区间会比对被解释变量平均值的预测区间更宽?

2.10如果有人利用中国1978年—2000年的样本估计的计量经济模型直接预测:“中国综合经济水平将在2050年达到美国2002年的水平”,你如何评论这种预测?

2.11对本章开始提出的”中国旅游业总收入将超过3000亿美元?”,你认为可以建立什么样的简单线性回归模型去分析?

练习题

2.1为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:

资料来源:《深圳统计年鉴2002》,中国统计出版社

(1)建立深圳地方预算内财政收入对GDP的回归模型;

请考虑下列模型:

(1)利用表中数据估计此模型的参数。

(2)你认为数据中有多重共线性吗?

(3)进行以下回归:

根据这些回归你能对数据中多重共线性的性质说些什么?

(4)假设数据有多重共线性,但在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?

________________

4.4自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?

4.5克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:

(括号中的数据为相应参数估计量的标准误)。

试对上述模型进行评析,指出其中存在的问题。

________________

4.6理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计数据,具体如下:

资料来源:《中国统计年鉴》2004、2000年版,中国统计出版社。

要求:

(1)建立对数线性多元回归模型

(2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?

(3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。

4.7在本章开始的“引子”提出的“农业和建筑业的发展会减少财政收入吗?”的例子中,如果所采用的数据如下表所示

1978-2003年财政收入及其影响因素数据

 

________________

题目解答

答案

<<4.3 答案 <<4.5 答案 <<4.7 答案

解析

多重共线性问题的识别与解决是本题的核心考查点。

  1. 多重共线性指解释变量之间存在高度线性相关关系,会导致参数估计不稳定、显著性检验不可靠。
  2. 识别方法:通过观察变量间的相关系数、方差膨胀因子(VIF)、回归系数符号异常或不显著等现象判断。
  3. 解决思路:增加样本量、剔除冗余变量、变量变换(如差分、合并变量)或使用正则化方法。

第(1)题

建立对数线性多元回归模型

模型形式

对数线性模型形式为:
$\ln Y = \beta_0 + \beta_1 \ln X_1 + \beta_2 \ln X_2 + \cdots + \beta_7 \ln X_7 + \epsilon$

变量选择

选择经济发展水平(X1)、收入水平(X2)、产业结构(X3-X5)、人民生活水平(X6)、能源转换技术(X7)作为解释变量,符合理论预期。

第(2)题

多重共线性预测

变量间关系分析

  • X1(GDP)与X2(国民总收入)高度相关(收入是GDP的主要组成部分)。
  • X3(工业)、X4(建筑)、X5(交通)可能存在行业关联性。
  • X6(电力消费)与X1、X2可能存在消费能力驱动关系。
    结论:多重共线性问题较大概率存在。

第(3)题

解决多重共线性的步骤

假设与数据准备

假设数据已标准化,且通过VIF检测确认共线性。

解决方法

  1. 逐步回归法:
    • 逐步引入变量,剔除VIF>10的变量(如X2、X4)。
  2. 岭回归:
    • 使用岭回归系数图选择合适惩罚参数$\lambda$,稳定估计。
  3. 变量合并:
    • 将X3、X4、X5合并为产业结构指数,降低维度。

相关问题

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • 设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号