16.(填空题,4.0分)某公司的邮件系统中垃圾邮件占总邮件的20%,经过历史数据分析发现,在垃圾邮件中,50%会包含关键词“折扣”,在正常邮件中,10%会包含关键词“折扣”.现收到一封新邮件,检测发现其中包含关键词“折扣”,问这封邮件实际是垃圾邮件的概率为_____(请用最简分数作答,如1/3)
某工厂有两种生产线(生产线A和生产线B)生产同一种零件。为了比较两条生产线的平均生产时间(单位:分钟)是否有显著差异,管理部门从生产线A随机抽取4个零件,计算得其生产时间的样本均值bar(X)=11.75,样本方差S_(1)^2=2.9;从生产线B随机抽取5个零件,计算得其生产时间的样本均值bar(Y)=13,样本方差S_(2)^2=2.5。假设两条生产线的生产时间均服从正态分布,且方差未知相等。为检验两条生产线的平均生产时间是否有显著差异,所用的检验统计量及检验结果为()。(显著性水平alpha=0.05,t_(0.025) =2.3645,t_(0.05) =1.8946,u_(0.025)=1.96,u_(0.05)=1.65) A. T=(bar(X)-bar(Y))/(sqrt(frac(2.9){4)+(2.5)/(5))}sim_(H_{0)} N(0,1),无显著差异B. T=(bar(X)-bar(Y))/(sqrt(frac(1){4)+(1)/(5))sqrt((3S_(1)^2+4S_{2)^2)/(7)}}sim_(H_{0)} t ,无显著差异 C. T=(bar(X)-bar(Y))/(sqrt(frac(2.9){4)+(2.5)/(5))}sim_(H_{0)} N(0,1),有显著差异D. T=(bar(X)-bar(Y))/(sqrt(frac(1){4)+(1)/(5))sqrt((3S_(1)^2+4S_{2)^2)/(7)}}sim_(H_{0)} t ,有显著差异
12. (2.0分) 样本是总体的全部单位。A. 对B. 错
偏度(skwmes)是表征概率密度曲线相对于平均值的不对称程度的特征数,对于正态分布而言,其偏度等于( ),表示概率密度曲线左右对称。A 3 B 1C 0 D-1
在参数估计中,贝叶斯估计不需要先验信息。A. 正确B. 错误
15.(填空题,4.0分)已知随机变量X,Y的相关系数为0.5,则2X+1与3Y+2的相关系数为_____.(请用小数或最简分数作答,如1/3)
某实验,有两个自变量A和B,其中A因素共有三类,B因素也有三类。交叉分组后共得到九种实验处理,每个处理中有两名被试。实验结束时对他们进行测试,最后获得的数据是反应时[1]间。经过数据分后,得到如下的结果分表。 差异来源 平方和 自由度 均方差 F值-|||-A因素 150-|||-B因素 180-|||-. B 160-|||-组内 160 ...-|||-总差异 ··· ··· ... 请问: (1)请将上表中空白的地方补充完整。(精确到小数点后两位) (2)指出该数据分的统计方法,检验了哪些效应,结果是否显著。 (下面是附表) 差异来源 平方和 自由度 均方差 F值-|||-A因素 150-|||-B因素 180-|||-. B 160-|||-组内 160 ...-|||-总差异 ··· ··· ...
设总体 X sim N(0, sigma^2),(X_1, X_2, ..., X_n) 是来自总体 X 的样本,则 (1)/(sigma^2) sum_(i=1)^n X_i^2 服从的分布是()。A. chi^2(n)B. N(0,1)C. chi^2(n-1)D. chi^2
参数是说明样本特征的,统计量是说明总体特征的()。A. 正确B. 错误
[单选] 采用比例积分控制规律是,如果对象滞后很大,可能会出现()的情况。A. 控制时间较短,最大偏差较大B. 控制时间较短,最大偏差较小C. 控制时间较长,最大偏差较大D. 控制时间较长,最大偏差较小
热门问题
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5.聚类分析可以看作是一种非监督的分类。()
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验