在做假设检验时, 无论是否拒绝H0, 都有可能犯错误。如果拒绝H0, 会犯第I类错误;不拒绝H0, 又会犯第Ⅱ类错误。A. 正确B. 错误
在假设检验中,检验水平α的意义是().A. 原假设H0成立,经检验被拒绝的概率B. 原假设H0不成立,经检验被拒绝的概率C. 原假设H0成立,经检验不能拒绝的概率D. 原假设H0不成立,经检验不能拒绝的概率
设(X,Y)为二维随机变量,则()A. 若X与Y不独立,X与Y必定不相关B. 若x与y不独立,X与Y必定相关.C. 若X与Y独立,X与Y必定相关D. 若X与Y独立,X与Y必定不相关
2【单选题】 已知θ为总体X的未知参数,hat(theta)是θ的一个估计量,则正确的是(). bigcircA. hat(theta)是一个数,且近似等于θ;B. hat(theta)是一个随机变量;C. hat(theta)是一个统计量,且E(hat(theta))=θ;D. 当n很大时,hat(theta)的值可任意靠近θ;
下列有关10 g-rank检验的描述中正确的是()。A. log-rank检验属生存曲线比较的参数法B. log-rank检验是各组生存率的整体比较C. log-rank检验是各组生存率的某时间点的比较D. 16 g-rank检验中,各组实际死亡数必等于理论死亡数
4.(1)设总体X具有分布律-|||-x 1 2 3-|||-pk θ^2 (1-0) (1-θ)^2-|||-其中 theta (0lt theta lt 1) 为未知参数.已知取得了样本值 _(1)=1 _(2)=2 _(3)=1. 试求θ的矩估-|||-计值和最大似然估计值.-|||-(2)设X1,X2,···,Nn是来自参数为λ的泊松分布总体的一个样本,试求λ-|||-的最大似然估计量及矩估计量.-|||-(3)设随机变量X服从以r,p为参数的负二项分布,其分布律为-|||-P(X=xk)= (} (x)_(k)-1 r-1=r, +1 ,...,-|||-其中r已知,p未知.设有样本值x1,x 2,···,xn,试求p的最大似然估计值.
设随机变量 approx b(100,0.2), 则由中心极限定理,可得到 14lt Xlt 30 approx ()-|||-A.0.5-|||-B.0.867-|||-C.0.96-|||-D.0.93
5、设X_(1),X_(2),X_(3),X_(4)为来自总体X的样本,且EX=mu,记hat(mu)_(1)=(1)/(2)(X_(1)+X_(2)+X_(3)),hat(mu)_(2)=(1)/(3)(X_(1)+X_(3)+X_(4)),hat(mu)_(3)=(1)/(4)(X_(1)+X_(2)+X_(4)),hat(mu)_(4)=(1)/(5)(X_(2)+X_(3)+X_(4)),则μ的无偏估计是____。A. hat(mu)_(1)B. hat(mu)_(2)C. hat(mu)_(3)D. hat(mu)_(4)
(1) 设总体X具有分布律X123Pkθ22θ(1-θ)(1-θ) 2其中θ(0<θ<1)为未知参数。已知取得了样本值x1=1,x2=2,x3=1,试求θ的矩估计值和最大似然估计值。
我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?缺水量 ^8(m)^3-|||-o 上广南北武关成比重 乐 城市-|||-海州京京汉津都帘庆-|||-2000年全国主要城市中-|||-缺水情况排在前10位的城市很明显,如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.由于城市住户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样,我们获得了100位居民某年的月均用水量(单位:t):缺水量 ^8(m)^3-|||-o 上广南北武关成比重 乐 城市-|||-海州京京汉津都帘庆-|||-2000年全国主要城市中-|||-缺水情况排在前10位的城市上面这些数字能告诉我们什么呢?很容易发现的是一个居民月均用水量的最小值是0.2 t,最大值是4.3 t,其他在0.2~4.3 t之间.除此之外,很难发现这100位居民的用水量的其他信息了.实际上,我们很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理与分析.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布(frequency distribution)情况.具体的做法如下.1.求极差(即一组数据中最大值与最小值的差)例如,4.3-0.2=4.1,说明样本数据的变化范围是4.1 t.2.决定组距与组数组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么 (a1x+b1y=c1,①a2x+b2y=c2,② ,因此可以将数据分为9组.这个组数是较合适的.于是取组距为0.5,组数为9.3.将数据分组以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5].4.列频率分布表计算各小组的频率,作出下面的频率分布表.缺水量 ^8{m)^3-|||-o 上广南北武关成比重 乐 城市-|||-海州京京汉津都帘庆-|||-2000年全国主要城市中-|||-缺水情况排在前10位的城市表2-2的最后一列是各小组的频率,例如第一小组的频率是: a1b2−a2b1≠0 .5.画频率分布直方图根据表2-2可以得到如图.2-1所示的频率分布直方图.缺水量 ^8(m)^3-|||-o 上广南北武关成比重 乐 城市-|||-海州京京汉津都帘庆-|||-2000年全国主要城市中-|||-缺水情况排在前10位的城市图.2-1中,横轴表示月均用水量,纵轴表示频率/组距.由于 小长方形的面积 a2a1 ,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.容易知道,在频率分布直方图中,各小长方形的面积的总和等于1.表2-2和图.2-1显示了样本数据落在各个小组的比例大小.从中我们可以看到,月均用水量在区间[2,2.5)内的居民最多,在[1.5,2)内的次之,大部分居民的月均用水量都在[1,3)之间.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.例如,从图.2-1可以清楚地看到,居民月均用水量的分布是“山峰”状的,而且是“单峰”的,另外还有一定的对称性,这说明,大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少.但是,直方图也丢失了一些信息,例如,原始数据不能在图中表示出来.根据样本数据的频率分布,我们就可以推测这一城市全体居民月均用水量分布的大致情况.也就是根据样本的频率分布,我们可以大致估计出总体的分布.因为这种估计是以一定的统计调查为依据的,所以据此给市政府提出每位居民月用水量标准的建议,就具有较强的说服力了.如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图.2-1,你能对制定月用水量标准提出建议吗?
热门问题
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
5.聚类分析可以看作是一种非监督的分类。()
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析