【填空题】随机误差表征测量数据的分散性,这种分散性可用___来定量描述
统计量是:()A. 由总体数据得到的量B. 用参数估计出来的C. 反应总体统计特征的量D. 描述样本特征的统计指标E. 样本的总和
将研究对象按主要特征分类,然后在每一类型中随机抽取一定数量的个体组成样本的方法为( )。A. 单纯随机抽样B. 系统抽样C. 分层抽样D. 整群抽样
三组分体系的自由度最大值4。A. 对B. 错
第二章思考题与练习题思考题2.1相关分析与回归分析的关系是什么?2.2什么是总体回归函数和样本回归函数?它们之间的区别是什么?2.3什么是随机扰动项和剩余项(残差)?它们之间的区别是什么?2.4为什么在对参数作最小二乘估计之前,要对模型提出古典假定?2.5总体方差和参数估计方差的区别是什么?2.6为什么可决系数可以度量模型的拟合优度?在简单线性回归中它与对参数的t检验的关系是什么?2.7有人说:“得到参数区间估计的上下限后,说明参数的真实值落入这个区间的概率为”,如何评论这种说法?2.8对参数假设检验的基本思想是什么?2.9为什么对被解释变量个别值的预测区间会比对被解释变量平均值的预测区间更宽?2.10如果有人利用中国1978年—2000年的样本估计的计量经济模型直接预测:“中国综合经济水平将在2050年达到美国2002年的水平”,你如何评论这种预测?2.11对本章开始提出的”中国旅游业总收入将超过3000亿美元?”,你认为可以建立什么样的简单线性回归模型去分析?练习题2.1为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:资料来源:《深圳统计年鉴2002》,中国统计出版社(1)建立深圳地方预算内财政收入对GDP的回归模型;请考虑下列模型:(1)利用表中数据估计此模型的参数。(2)你认为数据中有多重共线性吗?(3)进行以下回归:根据这些回归你能对数据中多重共线性的性质说些什么?(4)假设数据有多重共线性,但在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?________________4.4自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?4.5克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:(括号中的数据为相应参数估计量的标准误)。试对上述模型进行评析,指出其中存在的问题。________________4.6理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计数据,具体如下:资料来源:《中国统计年鉴》2004、2000年版,中国统计出版社。要求:(1)建立对数线性多元回归模型(2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?(3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。4.7在本章开始的“引子”提出的“农业和建筑业的发展会减少财政收入吗?”的例子中,如果所采用的数据如下表所示1978-2003年财政收入及其影响因素数据 ________________
以下哪些是交叉熵损失函数的特点?A. 交叉熵损失函数用于回归任务B. 交叉熵损失函数度量预测概率分布与真实分布的差距C. 交叉熵损失函数在分类任务中常用D. 交叉熵损失函数的值越小,模型预测越准确E. 交叉熵损失函数不适用于多分类问题
均数的抽样误差大小主要取决于:A. 总体均数B. 样本均数C. 总体标准差和样本量D. 个体差异
某人群脉搏数(次/分)的资料,该资料为()A. 观察单位B. 定性资料C. 定量资料D. 等级变量E. 样本资料
[甲龙巡]某人记录了50名病人体重的测定结果,经整理,表达为:小于50Kg的13人,介于50kg和70Kg间的20人,大于70kg的17人,这时体重转化为()A. 定量变量B. 有序分类变量C. 二分类变量D. 名义变量E. 计数变量
400G.已知某试验室日用电量(单位:度) sim N((100)^circ ,(5)^2), 设每天用电量是相互独立的,求:-|||-(1)某日用电量超过110度的概率;-|||-(2)一周(7天)内至多只有1天日用电量超过110度的概率;-|||-(3)日供电量至少达到多少时,才能以0.95以上的概率保证实验室正常生产?
热门问题
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5.聚类分析可以看作是一种非监督的分类。()
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性