【单选题】随着样本容量的增大,样本统计量也趋于接近总体参数,成为估计量是否优良的()标准。A. 无偏性B. 一致性C. 有效性D. 均匀性
84.(单选题)来源于直接的调查和科学实验的统计数据称为()。A. 一手数据B. 二手数据C. 次级资料D. 历史数据
第六章参数估计基础________区别:(1)含义不同:①s描述个体变量值(x)之间的变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。②标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2)与n的关系不同:n增大时,①s→σ(恒定)。②标准误减少并趋于0(不存在抽样误差)。(3)用途不同:①s:表示x的变异度大小,计算cv,估计正常值范围,计算标准误等②:参数估计和假设检验。联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。________答:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,说明了均数的抽样误差。________答:例如某医生从某地2000年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数为138.5g/L,标准差S为5.20g/L,标准误为1.04g/L。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其均数的离散情况。因此,标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,说明了均数的抽样误差。本例均数的标准误,此式将标准差与标准误从数学上有机地联系起来了,同时看出通过增加样本含量方法可以减少标准误。________________答:(1)单峰分布,以0为中心,左右对称;(2)ν越小,t值越分散,曲线的峰部越矮,尾部越高;(3)随着ν逐渐增大,t分布逐渐接近标准正态分布;当ν趋向∞时,t分布趋近标准正态分布。t分布曲线是单峰的;关于t= 0对称;自由度越大,t值越小________________给定自由度v,t分布曲线的双侧尾部面积为时对应的t值,记为并称为t的双侧界值;单侧界值:一侧尾部面积为时对应的t值;对称性得:单侧曲线下面积=2双侧曲线下面积;同样的尾部面积,t分布的界值要大于标准正态分布的界值________答:无论原始数据的总体分布形态如何,即对于任意分布而言,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,样本均数的标准误有公式(6-1)计算。________答:样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。标准误与标准差的区别:(1)前者表示均数变异的指标,后者是表示观察值变异的指标。(2)用途不同,标准差与均数结合估计参考值范围,计算变异系数,和标准误等;标准误用于估计参数的可信区间,进行假设检验等。(3)它们与样本含量n的关系不同,当样本含量n足够大时,标准差趋向稳定,而标准误随的增大而减小。联系:当样本量n一定时,标准误随标准差的大小而变化。________________________________________答:95%置信区间的精度要好于99%置信区间。因为置信度或置信水平有95%提高到99%时,置信区间由窄变宽,估计的精度下降。________答:当n足够大,且样本频率p和1—p均不太小时,如np与n(1—p)均大于5时,可用正态近似法求总体概率的置信区间。________答:区别:(1)意义不同:参考值范围是指通知总体中包括一定数量(如95%或99%)个体值的估计范围。可信区间是指按一定的可信度来估计总体参数所在范围。(2)计算方法不同。可信区间:从总体中作随机抽样,每个样本可以算出一个可信区间,如95%可信区间,意味着100次抽样,算得100个可信区间,平均有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)。5%是小概率事件,实际发生的可能性小,因此,在实际应用中就认为总体均数在算得的置信区间内,这种估计方法会冒5%犯错误的风险。参考值范围:指同质总体中大多数个体变量值的分布范围。95%参考值范围指同质总体中95%的个体值分布在此范围内。它与标准差有关,各个体值变异越大,该范围越宽,分布也越分散。________各样本均数不一定等于总体均数;样本均数间存在差异;样本均数的分布规律:围绕总体均数上下波动;样本均数的变异:由样本均数的标准差描述。________________________个体变异;抽样________________样本统计量与总体参数间的差异;样本统计量间的差异________答:总体中的个体间存在变异,在进行抽样研究时,样本的统计量不等于总体参数,这种误差称为抽样误差。均数的抽样误差:常用样本均数的标准差(简称标准误)反映均数抽样误差的大小。(理论值),(估计值)。率的抽样误差:常用率的标准误反映率的抽样误差的大小。(理论值),(估计值)。________答:合理的抽样设计,增大样本含量。________答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的________答:可信区间:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间(confidence interval, CI),又称置信区间。可信区间的两个要素:①准确性:又称可靠性,反映为可信度1-α的大小,显然可信度愈接近1愈好。②精确性:常用可信区间的长度CL-CU来衡量。当然长度愈小愈好。精确性与变量的变异程度大小、样本例数和1-α取值有关。在样本例数确定的情况下,二者是矛盾的。一般情况下,在可信度确定的情况下,增加样本例数,可减少区间长度,提高精度。
均数标准误与标准差的关系是:A. 三者均不是B. 后者大于前者C. 前者大于后者D. 两者相等
由两个独立样本计算得两个总体均数的可信区间,下列说法不正确的是()A. 若两个可信区间有重叠,可认为两样本均数差别无统计意义B. 若两个可信区间有重叠,可认为两样本均数差别有统计意义C. 若两样本均数差别无统计意义,两个总体均数之差的可信区间包含0D. 若两样本均数差别有统计意义,两个总体均数之差的可信区间不包含0E. 若两样本均数差别有统计意义,两个可信区间一定不会重叠
研究表明某市足月正常产男性新生儿重量均数3.4kg。某医生记录了某山区12名足月正常产男新生儿体重资料如下:4.0,3.6 ,3.3,3.8,3.7,3.4,3.5,3.6,3.8,3.7,3.9,3.2试问该地区男性新生儿体重是否大于该市男性新生儿重量
最基本的抽样调查方法是A. 整群抽样B. 分层抽样C. 系统抽样D. 多级抽样E. 单纯随机抽样
当自由度为无穷大时,t分布服从:A. x^2分布 B. 标准正态分布C. 正态分布D. F分布
自由度分析的主要目的是在系统求解之前,确定需要给定多少个变量,可以使系统有唯一确定的解。
关于抽样,下列说法错误的是A. 滚雪球抽样常用语某些特殊人群(如抽烟,酗酒,吸毒)B. 当总体中差异较大时,可采用系统抽样C. 分层抽样是应使各层内的差异性较小,层间差异较大D. 质性研究中,研究者常采用目的抽样的方法
热门问题
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
5.聚类分析可以看作是一种非监督的分类。()
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)