217.2024年春运期间,宁波交警共检查长途客车超1.5万辆次,旅游包车2300多辆次,面包车近1.2万辆次,危化品车6600多辆次。A. 正确B. 错误
1.单选题1.1 若总体X的期望E(X)=μ,方差D(X)=σ²未知,X_(1),X_(2),...,X_(n)是来自总体的样本,则下列随机变量中不能作为统计量的是()bigcircoverline(x)=(1)/(4)sum_(i=1)^4X_(i)bigcirc X_(1)+X_(4)-2mubigcirc(1)/(sigma^2)sum_(i=1)^4(X_(i)-overline(X))^2bigcirc(1)/(3)sum_(i=1)^4(X_(i)-overline(X))^2
据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房者中本地人购房比率p的区间估计,在置信水平为10%下,其允许误差E=。则:(1)这80名受访者样本中为本地购房者的比率是多少(2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查多少名购房者。
在数据分析领域,有一个很经典的案例,那就是“啤酒+尿布”的故事。这里体现了什么思维?A. 回归分析B. 对比思维C. 相关思维D. 远近度思维
统计学习题求解 四、计算题 1. 一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了1000个观众作样本,结果发现喜欢该节目的有750人。试以95.45%的概率估计观众喜欢这一专题节目的区间范围。(t=2) 2. 某公司所属40家企业的销售资料如下 年销售额(万元) 企业数 10万元以下 4 10-20 6 20-30 20 30-40 8 40万元以上 2 合计 40 计算: (1)该公司平均的销售额及标准差。 (2)如果已知另一家集团公司所属企业的平均销售额是25万元,标准差10.5万元,那么哪家集团企业内部的销售业绩比较均匀。 3. 某地2001-2009年国内生产总值的资料如表所示。试建立直线趋势预测模型,用最小平方法求解参数,并预测该地区2010年国内生产总值(GDP)。 某地2001-2009年国内生产总值 单位:亿元 年份 2001 2002 2003 2004 2005 2006 2007 2008 2009 GDP 50 56 59 64 68 72 77 81 86
某人每次射击时击中目标的概率为0.6,独立地进行5次射击,则击中目标的次数X服从()A. 二项分布B(5,0.6)B. 泊松分布P(2)C. 均匀分布U(0.6,3)D. 正态分布N(5,0.62)
系统评价一定要包含meta分析。A. 对B. 错
2.(2020江苏A 62)在统计某高校运动会参赛人数时,第一次汇总的结果是-|||-1742人,复核的结果是1796人,检查发现是第一次计算有误,将某学院参赛人数的-|||-个位数字与十位数字颠倒了。已知该学院参赛人数的个位数字与十位数字之和是10,-|||-则该学院的参赛人数可能是:-|||-A.64人 B.73人-|||-C.82人 D.91人
计算相关系数和进行回归分析时,必须区分自变量和因变量。A. 正确B. 错误
数据清洗是量化策略开发过程中不可缺少的一个环节,其结果质量直接关系到策略回测的准确度。因此,在数据分析之前,研究员往往会花费大量的时间来进行数据清洗工作。以下数据清洗的做法,不正确的有( )。A.数据录入过程,数据整合过程都可能会产生重复数据,可以直接删除B.Pandas中可以使用fillan方法替换缺失值数据C.对于数据中的离群值,不予处理D."3"和3是同一个值
热门问题
5.聚类分析可以看作是一种非监督的分类。()
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100