10.下面列出了30个美国NBA球员的体重(以磅计,1磅 =0.454kg. )数-|||-据.这些数据是从美国NBA球队 1990-1991 赛季的花名册中抽样得到的.-|||-225 232 232 245 235 245270 225 240 240-|||-217 195 225 185 200 220200 210 271 240-|||-220 230 215 252 225 220206 185 227 236-|||-(1)画出这些数据的频率直方图(提示:最大和最小观察值分别为271和-|||-185,区间[184.5,271.5]包含所有数据,将整个区间分为5等份,为计算方便,将-|||-区间调整为(179.5,279.5 ).-|||-(2)作出这些数据的箱线图.
[题目] 设某种产品50件为一批,如果每批产品中-|||-没有次品的概率为0.35,有1,2,3,4件次品的概率分-|||-别为0.25,0.2,0,18,0.02。今从某批产品中任取10-|||-件,检查出一件次品,求该批产品中次品不超过2件-|||-的概率?
数据集包含100个样本,其中正、反例各一半,假定学习算法所产生的模型是将新样本预测为训练样本数较多的类别(训练样本数相同时进行随机猜测),试给出用10折交叉验证法和留一法分别对错误率进行评估所得的结果
[单选,A1型题] 关于随机抽样,下面正确的是()A. 随机抽样即随意抽取个体B. 为了能使样本更好地代表总体,抽样时应精心挑选个体C. 抽样时应使总体中的每一个观察单位都有同等机会被抽取D. 抽样时样本量越大越好E. 随机抽样的首要目的是减少成本,以最小的花费达到预期结果
10.设总体服从正态分布),而是来自总体的简单随机样本,是样本均值,则
①将表 2-9 做成依次表,并写出极差与中数。-|||-②做次数分布表,并写出组距的计算方法;用有关公式计算x、M。、Md、S^2、S和CV。-|||-③绘出次数分布直方图和折线图。-|||-表 2-9 120瓶瓶装醋的检测结果-|||-423 566 472 457 473 461 452 503 436 490 468-|||-453 488 443 488 479 513 480 498 482 502 486-|||-452 481 468 531 503 533 474 493 495 505 493 512-|||-511 460 454 462 475 563 491 473 500 500 487 489-|||-.421 451 488 481 506 493 464 484 489 510 506 470-|||-435 492 447 491 491 478 504 489 500 498 496 463-|||-493 445 481 496 472 451 485 479 467 496 495 485-|||-508 492 492 471 492 495 463 432 498 498 489 494-|||-592 524 529 479 481 474 490 474 500 501 502 489-|||-.-609 538 468 499 497 477 523 481 512 489 506 495
研究某小区家庭用于文化方面(报刊,电视,网络,书籍等)的支出,=N,现抽取一个容量20的样本,调查结果列于下表:=N(1)估计该小区的文化支出,并给出置信水平95%的置信区间。(2)在上问的基础上,全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平为95%的置信区间,并比较比估计和简单估计的效率。
横截面数据是指同一时点上不同统计单位相同统计指标组A. 成的数据同一时点上相同统计单位相同统计指标组B. 成的数据同一时点上相同统计单位不同统计指标组C. 成的数据同一时点上不同统计单位不同统计指标组D. 成的数据
测定试样中P2O5质量分数(%),数据如下:8。44,8.32,8.45,8.52,8.69,8。38 .用Q检验法对可疑数据决定取舍,求平均值、平均偏差、标准偏差s和置信度选90%及99%的平均值的置信范围。(13分).
热门问题
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
5.聚类分析可以看作是一种非监督的分类。()
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确