调查对象确定的主要依据A. 调查目的B. 调查范围C. 划清总体同质范围D. 调查方法E. 调查时间
设(X_1,X_2,...,X_n)为来自总体Xsim N(0,1)的一个样本,统计量Y=(sqrt(n-1)X_1)/(sqrt(sum_(i=2)^n X_i^2)),则().A. Ysim chi^2(n-1)B. Ysim t(n-1)C. Ysim F(n-1,1)D. Ysim F(1,n-1)
第2章 线性回归模型的基本思想与最小二乘法2.1 总体回归函数(PRF)与样本回归函数(SRF)有何区别?答:总体回归函数和样本回归函数的区别是:总体回归函数准确地描述了某种状态下或某个范围内变量之间客观存在的关系,但一般是未知的,而样本回归函数是对总体回归函数的近似,是利用样本数据计算得到的。2.2 拟合优度[1]的含义是什么?答:拟合优度是回归直线对观测值的拟合程度,它的直观含义是因变量的变动能被自变量解释的比例。其定义是,。的值越接近1,说明回归直线对观测值的拟合程度越好,反之,的值越接近0,说明回归直线对观测值的拟合程度越差。2.3 误差与残差有何区别?答:残差指真实值与由样本回归函数所得的估计值的差,而误差是真实值与由总体回归函数所得的估计值的差。2.4 以下是某城市10个市场苹果需求()和价格()的数据:(1)计算。(2)假设(y)^2, ∑x^2,∑xy,计算系数的OLS估计量。(3)做出散点图和样本回归线(利用统计软件)。(4)估计苹果在本均值点的需求弹性()。答:(1)(y)^2, ∑x^2,∑xy(y)^2, ∑x^2,∑xy(y)^2, ∑x^2,∑xy(y)^2, ∑x^2,∑xy(y)^2, ∑x^2,∑xy这个数值有误,答案是 -143.6(2)(y)^2, ∑x^2,∑xy 有误,答案为 -5.203(y)^2, ∑x^2,∑xy 有误,答案为203.21(3)散点图和样本回归线如下图所示:(4) 答案应为-1.628也就是说当价格变动1时,需求将反向变动1.997。2.5 DATA1-1给出了中国2011年各省市GDP((y)^2, ∑x^2,∑xy)和投资()的数据。利用统计软件(Eviews或Stata)回答以下问题:(1)做散点图,观察投资对GDP的影响。(2)估计回归方程(y)^2, ∑x^2,∑xy。(3)你如何解释斜率系数的含义?答:(1)散点图如下:(2)以下是用eviews6.0输出的结果,可知:,即为所要求的估计回归方程。(3)斜率系数是指当投资变动1单位时,GDP将变动1.832478单位。另外,,这表明投资对GDP有正相关关系。而,表明投资的小幅度变动,将引起GDP更大幅度的变动,也就是说投资变动将引起较大的GDP变动。2.6 DATA2-2给出了美国1996-2006年GDP((y)^2, ∑x^2,∑xy)与城市失业率()的数据。利用统计软件回答以下问题:(1)估计(y)^2, ∑x^2,∑xy的变动(失业率增量:百分数)对(y)^2, ∑x^2,∑xy的变化率(经济增长率:百分数)的回归方程。(2)提取自变量的系数,你有什么发现?提示:研究奥肯定律。奥肯定律是指:经济增长超过潜在的经济增长水平的增量每提升一定幅度时,失业率将下降一个百分点。 答:(1)根据eviews6.0输出结果得到估计方程为:(y)^2, ∑x^2,∑xy(2)由(1)中所求的方程可以知道斜率,可知当GDP变动1个百分点时,失业率将反向变动0.0373个百分点。这很符合奥肯定律。 2.7 假设一元回归方程中的截距项为零,即,利用最小二乘法的思想计算斜率系数的估计量。计算及其估计量。答:(y)^2, ∑x^2,∑xy,残差平方和,两边对求导数,并令其为零:(y)^2, ∑x^2,∑xy,求得(y)^2, ∑x^2,∑xy从而(y)^2, ∑x^2,∑xy2.8 证明:因变量(y)^2, ∑x^2,∑xy对自变量(y)^2, ∑x^2,∑xy回归的拟合优度等于和的(样本)相关系数的平方,即,其中是和的(样本)相关系数。答:证明:(y)^2, ∑x^2,∑xy2.9 采用正文中的记号,试证明:(y)^2, ∑x^2,∑xy
回归分析是一种用来:()A. 预测未来的数据趋势B. 对数据进行分类的算法C. 检查数据中是否存在异常值或异常行为D. 发现数据中的关联规则
对于可视分析目标而言,适用于所有数据的目标有( )A. 特征B. 异常C. 分布D. 趋势
回归分析是一种用来:()A. 发现数据中的关联规则B. 对数据进行分类的算法C. 检查数据中是否存在异常值或异常行为D. 预测未来的数据趋势
若已知一份资料中,18名特征相同成年女子分两组用两种测量肺活量的仪器测最大呼吸率(L/min),比较两种方法检测结果有无差别,可进行A. 配对设计的Z检验B. 成组设计的t检验C. 配对设计的t检验D. 成组设计的Z检验E. q检验
某研究员研究某地500名8岁男孩的体重和肺活量,为了分析肺活量和体重的关系,适宜用()oA. 散点图B. 条图C. 点图D. 圆图E. 线图
在组距数列中,组中值是( )。A. 组平均数B. 用来代表各组标志值的平均水平C. 在开放式分组中,可以参照相邻组的组距来确定D. 在开放式分组中值无法确定E. 上限和下限之间的中点数值
某研究者在社区进行糖尿病患病率调查时,首先将全区的人群按经济条件分为好、较好、差三类,然后每一类各随机抽取1/100的人做调查。该研究者使用的抽样方法分别是( )。A. 整群抽样,机械抽样B. 系统抽样,单纯随机抽样C. 机械抽样,分层抽样D. 分层抽样,单纯随机抽样E. 单纯随机抽样,系统抽样
热门问题
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5.聚类分析可以看作是一种非监督的分类。()
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化