5,设总体 sim N(mu ,16) X1,X2,···,X10是来自总体X的一个容量为10的简单随机样-|||-本,S^2为其样本方差,且 ((S)^2gt a)=0.1 求a之值,
病例对照研究中,选择对照的方法主要有匹配和非匹配两种方法,那么下列可以作为匹配变量的是()A. 疾病因果链上的中间变量B. 只与可疑病因有关而与疾病无关的因素C. 如果避孕药的使用与宗教信仰有关,那么宗教信仰可以作为匹配因素D. 已知的混杂因素
38.判断题(1分)聚类的准则是最小化簇间距离,最大化簇内距离。()A. 对B. 错
5.[判断题]回归问题的输出结果是数值。()A. 对B. 错
七、(本小题9分):设随机变量具有概率密度函数其中为未知参数,为来自总体的样本。求的矩估计量和极大似然估计量。
对于正态概率分布,中位数、平均数和众数三者之间的关系是( )。A. 三者相等B. 平均数和众数相等C. 三者互不相等D. 平均数中位数相等,众数和它们不相等
6.甲、乙两个校对员彼此独立对同一本书的样稿进行校对,校完后,甲发现a个错字,乙发现b-|||-个错字,其中共同发现的错字有c个,试用矩估计给出如下两个未知参数的估计:-|||-(1)该书样稿的总错字个数;-|||-(2)未被发现的错字数.
异方差性将导致()。A. 普通最小二乘法估计量有偏和非一致B. 普通最小二乘法估计量非有效C. 普通最小二乘法估计量的方差的估计量有偏D. 建立在普通最小二乘法估计基础上的假设检验失效E. 建立在普通最小二乘法估计基础上的预测区间变宽
设总体X的密度函数为p(x,theta)=} (2)/(theta^2)(theta-x), & 0
违背基本假设的情况4.1 试举例说明产生异方差的原因。答:由于实际问题是错综负责的,因而在建立实际问题的回归分模型时,经常会出现某一因素或一些因素随着释变量[1]观测值的变化对被释变量产生不同的影响,导致随机误差[1][2]项产生不同方差。引起异方差的原因很多,但样本数据为截面数据(微观数据)时容易出现异方差。例如:研究居民家庭的储蓄行为Yi=b0+b1Xi+其中:Yi表示第i个家庭的储蓄额,Xi表示第i个家庭的可支配收入。由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以的方差呈现单调递增型变化。4.2 异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1)、参数估计量非有效2)、变量的显著性检验失去意义3)、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。由OLS求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。4.5(4.5)式一元加权最小二乘回归系数估计公式。 474.6验证(4.8)式多元加权最小二乘回归系数估计公式。 474.7 有同学认为当数据存在异方差时,加权最小二乘回归方程与普通最小二乘回归方程之间必然有很大的差异,异方差越严重,两者之间的差异就越大。你是否同意这位同学的观点?说明原因。 484.8 对例4.3的数据,用公式计算出加权变换残差,绘制加权变换残差,根据绘制出的形说明加权最小二乘估计的效果。 484.9 表4.12是用电高峰期每小时用电量y与每月总用电量x的数据。 491)用普通最小二乘法建立y与x的回归方程,并画出残差散点; 502)诊断该问题是否存在异方差 513)如果存在异方差,用幂指数型的权函数建立加权最小二乘回 归方程 524)用方差稳定变换=消除异方差 534.10 试举一可能产生随机误差项序列相关的经济例子。 554.11 序列相关性带来的严重后果是什么? 554.12 结DW检验的优缺点。 564.13 表4.13为某软件公司月销售额数据,其中,x为总公司的月销售额(万元);y为某分公司的月销售额(万元)。 561)用普通最小二乘法建立y关于x的回归方程 572)用残差及DW检验诊断序列的相关性 573)用迭代法处理序列相关,并建立回归方程 584)用一阶差分法处理数据,建立回归方程 605)比较普通最小二乘法所得回归方程和迭代法,一阶差分法所建立回归方程的优良性 614.14某乐队经理研究其乐队CD盘的销售额(y),两个有关的影响变量是每周演出场次 631)用普通最小二乘法建立y与和的回归方程,用残差及DW检验诊断序列的自相性 642)用迭代法处理序列相关,建立回归方程 663)用一阶差分法处理序列相关,建立回归方程 664)用最大似然法处理序列相关,建立回归方程 675)用科克伦-奥克特迭代法处理序列相关,建立回归方程 686)用普莱斯-温斯登迭代法处理序列相关,建立回归方程 684.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。答:加权最小二乘估计的方法是在平方和加入一个适当的权数,以调整各项在平方和中的作用。一元线性回归的加权最小二乘的离差平方和为:其中,为给定的第i个观测值的权数。加权最小二乘估计就是寻找参数的估计值,使得上述离差平方和达到极小。如果所有的权数都相等,则都等于某个常数,此时问题就成为了普通最小二乘法。可以证明最小二乘估计为:加权最小二乘估计的计算可以用SPSS软件完成。有关权数的确定:(1)为了使离差平方和中各项的地位相同,观测值的权数应该是观测值误差项方差的倒数,即:(2)在实际问题的研究中,误差项的方差通常是未知的,但是误差项方差随自变量水平以系统的形式变化时,我们可以利用这种关系。如,已知误差项方差与成比例,那么=k,其中k为比例系数。权数为:=1/(k),因为比例系数k在参数估计中可以消去,所以我们可以直接使用权数:=1/(3)在社会,经济研究中,经常会遇到这种特殊的权数,即误差项方差与x的幂函数成比例,其中,m为待定的未知数。此时的权函数为:=1/4.5(4.5)式一元加权最小二乘回归系数估计公式。证明:4.6验证(4.8)式多元加权最小二乘回归系数估计公式。证明:对于多元线性回归模型 (1),即存在异方差。设,用左乘(1)式两边,得到一个新的的模型:,即。因为,故新的模型具有同方差性,故可以用广义最小二乘法估计该模型,得原式得证。4.7 有同学认为当数据存在异方差时,加权最小二乘回归方程与普通最小二乘回归方程之间必然有很大的差异,异方差越严重,两者之间的差异就越大。你是否同意这位同学的观点?说明原因。答:不同意。当回归模型存在异方差时,加权最小二乘估计(WLS)只是普通最小二乘估计(OLS)的改进,这种改进可能是细微的,不能理为WLS一定会得到与OLS截然不同的方程来,或者大幅度的改进。实际上可以构造这样的数据,回归模型存在很强的异方差,但WLS 与OLS的结果一样。加权最小二乘法不会消除异方差,只是消除异方差的不良影响,从而对模型进行一点改进。4.8 对例4.3的数据,用公式计算出加权变换残差,绘制加权变换残差,根据绘制出的形说明加权最小二乘估计的效果。
热门问题
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
5.聚类分析可以看作是一种非监督的分类。()
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性