数据缺失率高,重要性低,应该怎么清洗()A. 去除B. 不做处理C. 简单填充D. 计算填充
例6.2.3 设X1,X 2,···,X5是来自总体 sim N(0,1) 的样本,求常数c,使统-|||-计量 dfrac (c({X)_(1)+(X)_(2))}(sqrt {{{X)_(3)}^2+({X)_(4)}^2+({X)_(5)}^2}} 服从t分布,
8.(多选题,1.0分)下列关于参数估计的说法正确的是( )。A 矩估计的基本思想是,用样本矩作为总体矩的估计B 设总体Xsim N(mu,sigma^2),若sigma^2未知,总体均值mu的置信度为1-a的置信区间为(overline(X)-t_(alpha)(n)(S)/(sqrt(n)),overline(X)+t_(alpha)(n)(S)/(sqrt(n)))C 极大似然估计的基本思想是,用使样本出现可能性最大的参数作为总体参数的估计D 总体均值mu置信度为95%的置信区间为(hat(theta)_(1),hat(theta)_(2)),意味着mu的真值以95%的概率落入区间(hat(theta)_(1),hat(theta)_(2))内E 在区间估计中,样本容量确定时,区间长度的大小(精度)提高,置信度也会提高F 在其它条件不变的情况下,总体方差sigma^2越大,则总体均值mu的置信区间长度就越大
儿童年龄组别体重是以实测体重与同龄组标准体重比较,在标准体重均值的范围是A. 2个标准差范围内B. 5个标准差范围内C. 3个标准差范围内D. 4个标准差范围内E. 6个标准差范围内
多因素线性回归SPSS软件操作路径是?A. 分析—统计描述---探索B. 分析—一般线性模型—线性C. 分析—回归--线性D. 分析—均数比较—线性
某学校为了了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( )A. (C)_(400)^45•(C)_(200)^15种B. (C)_(400)^20•(C)_(200)^40种C. (C)_(400)^30•(C)_(200)^30种D. (C)_(400)^40•(C)_(200)^20种
随机现象的特点是( )A. 在一定条件下,可能发生某种结果,也可能不发生某种结果B. 在一定条件下,发生必然结果C. 在一定条件下,不可能发生某种特定的结果D. 在一定条件下,发生某种结果的概率微乎其微
在某次护理教育学期末测试中,一道论述题满分25分,全体考生平均得分16.25分,则该题的难度指数P的值为()
对一个3人小组的砌墙工作进行定额测定,该组工人经过一天的工作(其中共损失4h时间),砌筑了25m3的墙体,该组工人的产量定额为( )。A. 0.1B. 10C. 0.12D. 8.33
【单选题】三组偏态数据分析,有三种统计分析方法。第一种,将偏态的定量数据转成二分类的数据进行分析,第二种方法,将偏态的定量数据转成4等级的有序数据进行分析,第三种,不进行转化,直接进行统计分析。请问,要比较三组数据总体程度上有无差异性,这三种方法哪一种数据检验效能最低?A. 第一种B. 第二种C. 第三种D. 难以确定哪种
热门问题
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
5.聚类分析可以看作是一种非监督的分类。()
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化