属于专门调查的有( ).A. 普查B. 抽样调查C. 典型调查D. 重点调查
某企业产品销售量历年的增长速度如下:第一年 第二年 第三年 第四年 第五年环比增长速度(%) 7 6.6 定基增长速度(%) 7 15 30 39试求五年间年平均增长速度,并指出增长最快的两年是哪两年?
1.设X1,X2,···,Nn为总体的一个样本,x1,x2,···,xn为一组相应的样本观察值,求下述-|||-各总体的密度函数或分布律的未知参数的矩估计量和估计值以及最大似然估计量.-|||-(1) f(x)= { ^-(theta +1), xgt c 0, x=0 ,1,2,···,m, (0lt plt 1) 为未知参数.-|||-(m/x)p^x(1-p)^(m-x),其中
相关分析和回归分析的区别与联系(不知道要不要)联系:都是研究非确定性变量间的统计依赖关系,并能度量线性依赖程度的大小。区别:从研究目的上看:相关分析是研究变量间相互联系的方向和程度;回归分析是寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测[1]因变量的值。从对变量的处理来看:相关分析中的变量均为随机变量,不考虑两者的因果关系;回归分析是在变量因果关系的基础上研究自变量对因变量的具体影响,必须明确划分自变量和因变量,回归分析中通常假定自变量为非随机变量,因变量为随机变量。P26-27:随机干扰项:观察值Y围绕它的期望值[2]的离差,是一个不可观测的随机变量,又称为随机干扰项或随机误差[3]项。引入随机干扰项的原因1)代表未知的影响因素;2)代表残缺数据;3)代表众多细小影响因素;4)代表数据观测误差;5)代表模型设定[4]误差;6)变量的内在随机性。P26、28:样本回归函数和总体回归函数的公式总体回归函数:在给定解释变量[5]X条件下被解释变量Y的期望轨迹称为总体回归线,或更一般地称为总体回归曲线。相应的函数称为(双变量)总体回归函数(PRF)。确定形式:随机形式:样本回归函数SRF画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线。该直线称为样本回归线(sample regression lines)。样本回归线的函数形式[6]称为样本回归函数.确定形式:随机形式:P29:图2.1.3回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。这就要求设计一方法构造SRF使其尽可能接近PRF。这里的PRF可能永远无法知道。P30-32:一元线性回归模型的基本假设假设1、回归模型是正确的。(选择了正确的变量;选择了正确的函数形式。)假设2、解释变量X是确定性变量,不是随机变量,在重复抽样中取固定值。_(i)=(overline {Y)_(i)}+overline ({u)_(i)}=(P)_(0)+(overline {{P)_(1)}(X)_(i)+(e)_(i)假设3、解释变量X在所抽取的样本中具有变异性,而且随着样本容量的无限增加,解释变量X的方差趋于一个非零的有限常数。假设4、随机误差项具有给定X条件下的零均值、同方差和不序列相关性:E(i)=0Var (i)=2Cov(i,j)=0i≠j i,j= 1,2, …,n假设5、随机误差项与解释变量X之间不相关:Cov(Xi,i)=0 i=1,2, …,n_(i)=(overline {Y)_(i)}+overline ({u)_(i)}=(P)_(0)+(overline {{P)_(1)}(X)_(i)+(e)_(i)假设6、随机误差项服从零均值、同方差、零协方差的正态分布注意:如果假设1、2满足,则假设3也满足;如果假设4满足,则假设2也满足。i~N(0,2) i=1,2, …,nP33:最小二乘法的推导过程(推导至2.3.5)普通最小二乘法(OLS)给出的判断标准是:二者之差的平方和_(i)=(overline {Y)_(i)}+overline ({u)_(i)}=(P)_(0)+(overline {{P)_(1)}(X)_(i)+(e)_(i)最小。P38-40:最小二乘估计法的性质(重点看前三个,知道线性性和无偏性的推导)(1)线性性,即它是否是另一随机变量的线性函数;(2)无偏性,即它的均值或期望值是否等于总体的真实值;(3)有效性,即它是否在所有线性无偏估计量中具有最小方差。P44:图2.4.2区别那三个平方和(TSS,ESS,RSS)TSS=ESS+RSSY的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。总体平方和回归平方和残差平方和P45:可决系数R2统计量拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优度的指标:判定系数(可决系数)R2_(i)=(overline {Y)_(i)}+overline ({u)_(i)}=(P)_(0)+(overline {{P)_(1)}(X)_(i)+(e)_(i)可决系数的取值范围:[0,1]R2________________________。P46-47:t检验(2.4.5)P49:如何才能缩小置信区间(2个)增大样本容量n。因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;提高模型的拟合优度。因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。
9--2010学年度统计学原理期末试题及答案》分享作者:________已被分享6次________________________________________________《统计学基础》试题(一)一、单项选择题(每题1分,共20分)1.下面属于连续变量的是()A、职工人数B、机器台数C、工业总产值D、车间数2.人均收入,人口密度,平均寿命,人口净增数,这四个指标中属于质量指标的有()。A、1个B、2个C、3个D、4个3.保定市工商银行要了解2000年第一季度全市储蓄金额的基本情况,调查了储蓄金额最高的几个储蓄所,这种调查属于()A、重点调查B、典型调查C、抽样调查D、普查4.若两变量完全相关,则估计标准误()。A、为0 B、为1 C、为–1 D、为无穷大5.某外商投资企业按工资水平分为四组:1000元以下,1000~1500元;1500~2000元;2000元以上。第一组和第四组的组中值分别为()A、750和2500 B、800和2250 C、800和2500 D、750和22506.1990年,我国人均粮食产量393.10公斤,人均棉花产量3.97公斤,人均国民生产总值为1558元,人均国民收入1271元它们是()。A、结构相对指标B、比较相对指标C、比例相对指标D、强度相对指标7.按照计划规定,工业总产值与上年对比需增长30%,实际却比计划少完成了10%,同上年相比,今年产值的实际增长率为()。A、60%B、120%C、40%D、17%8.下列指标中属于结构相对指标的是()。A、产值计划完成程度B、净产值占总产值的比重C、产值资金占用率D、百元流动资金利税率9.直线回归方程中,若回归系数为负,则()。A、表明现象正相关B、表明现象负相关C、表明相关程度很弱D、不能说明相关的方向和程度10.已知某企业总产值2001年比1998年增长187.5%,2000年比1998年增长150%,则2001年比2000年增长()。A、37.5%B、125%C、115%D、15%11.对直线趋势yc=100+9x,若x每增加一个单位,则y平均增加()。A、100个单位B、9个单位C、109个单位D、91个单位12.有一批灯泡共1000箱,每箱200个,现随机抽取20箱并检查这些箱中全部灯泡,此种检验属于()。A、纯随机抽样B、类型抽样C、整群抽样D、等距抽样13.时间数列中所排列的指标数值()A、只能是绝对数B、只能是相对数C、只能是平均数D、可以是绝对数,也可以是相对数或平均数14.下列属于时点数列的是()。A、某厂各年工业产值B、某厂各年劳动生产率C、某厂各年生产工人占全部职工的比重D、某厂各年年初职工人数15.在抽样推断中,抽样误差是()A、可以避免的B、可避免且可控制C、不可避免且无法控制D、不可避免但可控制16.某厂有两个车间,1984年甲车间工人平均工资为120元,乙车间为130元;1985年,甲车间工人在全厂工人中的比重提高,乙车间的比重下降。在两车间工人平均工资没有变化的情况下,1985年全厂总平均工资比1984年全场总平均工资()。A、增加B、减少C、持平D、不能作结论17..某10位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计算平均数,结果满足()。A、算术平均数=中位数=众数B、众数gt;中位数gt;算术平均数C、中位数gt;算术平均数gt;众数D、算术平均数gt;中位数gt;众数18.抽样调查所特有的误差是()。A、由于样本的随机性而产生的误差B、登记误差C、系统性误差D、ABC都错19.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程是()。A、B、C、D、20.如果采用三项移动平均修匀时间数列,那么所得修匀数列比原数列首尾各少()A、一项数值B、二项数值C、三项数值D、四项数值二、多项选择题1.工业总产值(工厂法计算),这一指标中还缺少的构成要素是()A计量单位B指标名称C时间限制D空间限制E计算方法2.通过调查鞍钢、首钢、宝钢等几个大钢铁基地来了解我国钢铁的基本情况,这种调查属于()A重点调查B典型调查C抽样调查D非全面调查E普查3.下列指标属于时点指标的有()。A、人口数B、新出生人口C、商品库存量D、国民收入E、职工人数4.下列指标属于动态相对指标的有()。A、1981年到1990年我国人口平均增长1.48%B、1990年国民生产总值为1980年的236.3%C、1990年国民生产总值中,第一、二、三产业分别占28.4%、44.3%、27.3%D、1990年国民收入为1952年的2364.2%5.直线相关分析的特点有()。A、两变量不是对等的B、两变量只能算出一个相关系数C、相关系数有正负号D、两变量都是随机的E、相关系数的绝对值是介于0-1之间的数三、简答题1.什么是标志与指标?它们之间有什么区别与联系。2.平均数有哪几种类型?3.相关与回归分析的关系?4.简述影响抽样误差大小的因素四、计算题1.某地区国民生产总值(GNP)在1988-1989年平均每年递增15%,1990-1992年平均每年递增12%,1993-1997年平均每年递增9%,试计算:1)该地区国民生产总值这十年间的总发展速度及平均增长速度2)若1997年的国民生产总值为500亿元,以后每年增长8%,到2000年可达到多少亿元?2.某地有八家银行,从它们所有的全体职工中随机动性抽取600人进行调查,得知其中的486人在银行里有个人储蓄存款,存款金额平均每人3400元,标准差500元,试以95.45%的可靠性推断:(F(T)为95.45%,则t=2)1)全体职工中有储蓄存款者所占比率的区间范围2)平均每人存款金额的区间范围3.某厂产品产量及出厂价格资料如下表:产品名称计量单位产量出厂价格(元)基期报告期基期报告期甲乙丙吨台件60001000040000 50001200041000 1105020 1006020要求:对该厂总产值变动进行因素分析。(计算结果百分数保留2位小数)4.银行储蓄存款余额和存户数有直线相关关系,根据这种关系,以及前几年的历史资料建立起以下回归方程yc=31,330,000+800xx代表存款户数(户)y代表存款余额(元)问:当x为10000户时,存款余额可能是多少?800的经济意义是什么?5.某市1999年零售香烟摊点调查资料如下表所示,试计算该零售香烟摊点的月平均数。调查时间1998年末1999年3月1日6月1日10月1日12月31日摊点个数(个)444 488 502 554 512《统计学原理》(一)答案一、单项选择题1.C 2.C 3.A 4.A 5.D 6.D 7. D 8.B 9.B 10 D 11.B 12.C 13.D 14.D 15.D 16.B 17.D 18D 19A 20.A二、多项选择题1.ACD 2.AD 3.ACE 4.BD 5BCDE三、简答题四、计算题1.(1)该地区GNP在这十年间的总发展速度为115%2×112%3×109%5=285.88%平均增长速度为(2)2000年的GNP为500(1+8%)13=1359.81(亿元)2.(1)已知:n=600,p=81%,又F(T)为95.45%,则t=2所以故全体职工中有储蓄存款者所占比率的区间范围为81%±0.1026%(2)平均每人存款金额的区间范围为3.①总产值指数总成本增加量Σp1q1-Σp0q0=-=80000(元)②产量指数因产量变动而使总产值增加额Σp0q1-Σp0q0=-=10000(元)③出厂价格指数因出厂价格变动而使总产值增加额Σp1q1-Σp0q1=-=70000(元)④从相对数验证二者关系104.08%=100.51%×103.55从绝对数验证二者关系80000=10000+700004.当x为10000户时,存款余额为yc=31,330,000+800×10,000=39,330,000(元)800的经济意义是每增减一个储户,银行储蓄存款余额相应地增减800元。5.该零售香烟摊点的月平均数为
某班的经济学成绩如下: 43, 55, 56, 59, 60, 67, 69, 73, 75, 76, 76, 78,79, 80, 81, 82, 83, 83, 83, 84, 86, 87, 88, 88, 89, 90, 90, 95, 97.该 班经济学成绩的众数是( )A. 80B. 90C. 83D. 93
9. 以下说法中不正确的是 ______.A. 方差除以其自由度就是均方B. 方差分析时要求各样本来自相互独立的正态总体C. 方差分析时要求各样本所在总体的方差相等D. 完全随机设计的方差分析时,组内均方就是误差均方E. 完全随机设计的方差分析时,F=MS 组间 /MS 组内
4.某保险公司欲对某地区家庭拥有私人汽车的情况进行调查,该地区拥有20万户家-|||-庭,在全体居民中按简单随机抽样方法抽出70户家庭,调查后发现其中8户家庭-|||-拥有私人汽车。-|||-要求:-|||-(1)试估计该地区拥有私人汽车的家庭比例并给出抽样标准误。-|||-(2)在以95%的概率保证程度要求估计的极限误差不超过5%时,计算所需的样-|||-本量。 __
2.在总体N(12,4)中随机抽一容量为5的样本x_(1),x_(2),x_(3),x_(4),x_(5).(1)求样本均值与总体均值之差的绝对值大于1的概率.
10.设X_(1),X_(2),... X_(100)为来自总体X的简单随机样本,其中P(X=0)=P(X=1)=0.5,φ(x)表示标准正态分布函数,利用中心极限定理可得Psum_{i=1)^100X_(i)leq55}的近似值为()A. 1-φ(1)B. φ(1)C. 1-φ(0.2)D. φ(0.2)
热门问题
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5.聚类分析可以看作是一种非监督的分类。()
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3