在处理缺失值时,以下哪些方法是有效的?A. 使用均值或中位数填充缺失值B. 直接删除所有包含缺失值的样本C. 使用插值法估计缺失值D. 使用机器学习模型预测缺失值E. 忽略缺失值,因为缺失值不会影响模型性能
8.已知总体X服从正态分布N(μ,σ²),其中μ∈R和σ²>0均未知,X_(1),X_(2),…,X_(16)是来自总体X的简单随机样本,对假设检验问题H_(0):sigma^2=2,H_(1):sigma^2=5,取拒绝域W=S^2geq3.679,则该检验犯第二类错误的概率为____。
设总体X~f(x,θ),θ为未知参数,X1,X2,…,Xn为X的一个样本,θ1(X1,X2,…,Xn).θ2(X1,X2,…,Xn)为两个通缉量(θ1,θ2)为θ的置信度为1-α的置信区间,则应有().A. P(θ1B. P(θC. P(θ1D. P(θ
根据大量调查,已知健康成年男子脉搏的均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?试问该题应该用哪一类检验方法?A. 四格表资料卡方检验B. 配对t检验C. R*C表卡方检验D. 两独立样本t检验E. 单样本t检验
14/20 单选题(分值5.0分,难度:易) 14.在描述一组数据的分布形态时,以下哪个图形最为直观?()A. 条形图B. 直方图C. 折线图D. 散点图
选择200名6岁儿童进行某传染病的免疫接种试验,在2年的观察期间,90%的接种者未发生该传染病。下列说法正确的是()A. 该疫苗有效,因为有90%的儿童未发生该传染病B. 该疫苗无效,因为有10%的儿童发生该传染病C. 不能下结论,因为未设对照组D. 不能下结论,因为未进行统计学检验E. 不能下结论,因为研究对象不够多
若二维随机变量(X,Y)~N(2,3,9,16,0.5),则X~N(2,3),Y~N(9,16)。( )A 错误B 正确
以下不是x²检验的用途A. 推断两个或两个以上总体率之间有无差别B. 交叉分类资料两属性间有无相关关系C. 检验频数分布与理论分布的拟合优度D. 推断两个或两个以上总体构成比之间有无差别E. 推断两个或两个以上总体均数之间有无差别
若X ~ N(3, 4) ,Y ~ N(4, 9),且X,Y相互独立,则X + Y ~_______。
5.设X_(n)表示将一枚均匀硬币随意抛掷n次“正面”出现的次数,Phi(x)为标准正态分布函数,则(A) lim_(ntoinfty)P(X_{n)-n)/(sqrt(n))leq x}=Phi(x)(B) lim_(ntoinfty)P(2X_{n)-n)/(sqrt(n))leq x}=Phi(x)(C) lim_(ntoinfty)P(X_{n)-2n)/(sqrt(n))leq x}=Phi(x)(D) lim_(ntoinfty)P(2X_{n)-2n)/(sqrt(n))leq x}=Phi(x)
热门问题
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
5.聚类分析可以看作是一种非监督的分类。()
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验