截至2021年,我国居民人均预期寿命已达到()A. 74.8岁B. 76.3岁C. 78.2岁D. 79岁
⏺第13章 时间序列分析和预测13.1 下表是1981年—1999年国家财政用于农业的支出额数据(1)绘制时间序列图描述其形态。 (2)计算年平均增长率。 (3)根据年平均增长率预测2000年的支出额。 详细答案: (1)时间序列图如下: 从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。 (2)年平均增长率为: 。 (3) 。13.2 下表是1981年—2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2)(1)绘制时间序列图描述其形态。 (2)用5期移动平均法预测2001年的单位面积产量。 (3)采用指数平滑法,分别用平滑系数a=0.3和a=0.5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适? 详细答案: (1)时间序列图如下: (2)2001年的预测值为: | (3)由Excel输出的指数平滑预测值如下表:年份 单位面积产量 指数平滑预测 a=0.3误差平方 指数平滑预测 a=0.5误差平方 19811451198213721451.06241.01451.06241.0198311681427.367236.51411.559292.3198412321349.513808.61289.83335.1198512451314.34796.51260.9252.0198612001293.58738.51252.92802.4198712601265.429.51226.51124.3198810201263.859441.01243.249833.6198910951190.79151.51131.61340.8199012601162.09611.01113.321518.4199112151191.4558.11186.7803.5199212811198.56812.41200.86427.7199313091223.27357.61240.94635.8199412961249.02213.11275.0442.8199514161263.123387.71285.517035.9199613671308.93369.91350.7264.4199714791326.423297.71358.914431.3199812721372.210031.01418.921589.8199914691342.116101.51345.515260.32001年a=0.3时的预测值为: a=0.5时的预测值为: 比较误差平方可知,a=0.5更合适。13.3 下面是一家旅馆过去18个月的营业额数据(1)用3期移动平均法预测第19个月的营业额。 (2)采用指数平滑法,分别用平滑系数a=0.3、a=0.4和a=0.5预测各月的营业额,分析预测误差,说明用哪一个平滑系数预测更合适? (3)建立一个趋势方程预测各月的营业额,计算出估计标准误差。 详细答案: (1)第19个月的3期移动平均预测值为:(2)由Excel输出的指数平滑预测值如下表: a=0.3时的预测值: ,误差均方=87514.7。 a=0.4时的预测值: ,误差均方=62992.5.。 a=0.5时的预测值: ,误差均方=50236。 比较各误差平方可知,a=0.5更合适。 (3)根据最小二乘法,利用Excel输出的回归结果如下:。估计标准误差 。13.4 下表是1981年—2000年我国财政用于文教、科技、卫生事业费指出额数据(1)绘制时间序列图描述其趋势。 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的支出额。 详细答案: (1)趋势图如下: (2)从趋势图可以看出,我国财政用于文教、科技、卫生事业费指出额呈现指数增长趋势,因此,选择指数曲线。经线性变换后,利用Excel输出的回归结果如下:, ; , 。所以,指数曲线方程为: 。 2001年的预测值为: 。13.5 我国1964年~1999年的纱产量数据如下(单位:万吨):(1)绘制时间序列图描述其趋势。 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测2000年的产量。 详细答案: (1)趋势图如下: (2)从图中可以看出,纱产量具有明显的线性趋势。用Excel求得的线性趋势方程为:2000年预测值为: =585.65(万吨)。13.6 对下面的数据分别拟合线性趋势线 、二阶曲线 和阶次曲线 。并对结果进行比较。详细答案: 在求二阶曲线和三阶曲线时,首先将其线性化,然后用最小二乘法按线性回归进行求解。用Excel求得的趋势直线、二阶曲线和三阶曲线的系数如下:各趋势方程为: 线性趋势: 二阶曲线: 三阶曲线: 。 根据趋势方程求得的预测值和预测误差如下表:时间t 观测值Y 直线 二阶曲线 三阶曲线 预测 误差平方 预测 误差平方 预测 误差平方 1372373.52.4379.961.6373.42.02370372.98.6378.166.0374.015.63374372.32.8376.56.1374.20.14375371.710.8374.90.0374.20.65377371.134.9373.413.3374.08.96377370.542.5371.926.1373.611.67374369.917.1370.512.2373.01.18372369.37.6369.27.9372.20.09373368.619.0367.925.7371.23.110372368.015.8366.727.6370.23.311369367.42.5365.611.4369.00.012367366.80.0364.65.9367.70.613367366.20.7363.611.6366.40.314365365.60.3362.75.4365.10.015363365.03.8361.81.4363.70.516359364.328.5361.04.2362.311.117358363.732.8360.35.4361.08.918359363.116.9359.70.5359.70.5不同趋势线预测的标准误差如下: 直线: 二阶曲线: 三阶曲线: 比较各预测误差可知,直线的误差最大,三阶曲线的误差最小。 从不同趋势方程的预测图也可以看出,三阶曲线与原序列的拟合最好。 13.7 下表是1981—2000年我国的原煤产量数据(1)绘制时间序列图描述其趋势。 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的产量。 详细答案: (1)原煤产量趋势图如下: 从趋势图可以看出,拟合二阶曲线比较合适。 (2)用Excel求得的二阶曲线趋势方程为: 2001年的预测值为: 。(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意义。(5)检验回归方程线性关系的显著性(a=0.05)。(6)如果某地区的人均GDP为5 000元,预测其人均消费水平。(7)求人均GDP为5 000元时,人均消费水平95%的置信区间和预测区间。
多元线性回归的现实意义是分析多个自变量对因变量的影响,在刨除其他自变量的影响的同时,展示某个自变量对因变量的影响。() A. 正确B. 错误
比较不同性质、不同单位或不同平均数的样本的变异程度时,应采用的变异数是A. 标准差B. 变异系数C. 极差D. 方差
3.设x_(1),x_(2),...,x_(16)是来自正态总体N(mu,4)的样本,考虑检验问题H_(0):mu=6 vs H_(1):muneq6,拒绝域取为W=overline{x)-6|geqslant c},试求c使得检验的显著性水平为0.05,并求该检验在mu=6.5处犯第二类错误的概率.
对于任意两个随机变量X和Y,都有E(XY) = E(X)E(Y)成立。( )
方差分析的条件是A. 各样本是相互独立的随机样本B. 各样本来自正态分布总体C. 各总体方差相等D. 以上都是E. 以上都不是
百分位数既可以用于描述数值变量资料集中趋势,也可以描述其离散趋势()A. 正确B. 错误
5.判断题(2分)在模型评估中,准确率是指正确预测的样本数与总预测样本数之比。根据定义,准确率越高,模型的性能越好。因此,可以认为准确率是唯一需要关注的评估指标。( )A. 错B. 对
设X_1, X_2, X_3是相互独立的随机变量,且E(X_i)=1, D(X_i)=8 (i=1,2,3)。 令overline(X)=(1)/(3)(X_1+X_2+X_3),则估计P(|overline(X)-1|A. (5)/(6)B. (5)/(7)C. (5)/(8)D. 以上都不对
热门问题
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小