五、计算分析题(7小题,共59.0分)[1]某储蓄所按定期存款帐号进行每隔5号的系统抽样调查,调查资料如下:存款金额张数(张)1000以下1000—30003000—50005000—70007000以上301502505020合计500在95%的概率下估计:(1)该储蓄所所有定期存单的平均存款范围、定期存款总额;(2)定期存款在5000元以上的存单数所占的比重、定期存款在5000元以上的存单张数[2]为研究收入与受教育程度之间的关系,现抽取一个包括20个人的随机样本,得到资料如下:编号受教育程度平均年收入(元)编号受教育程度平均年收入(元)1250121112216902496801213247503828432131430100488774141424798582100315152853261026565161526000712254281716389088122311318162205091222500191733060101219456202148276(1)画出平均年收入与受教育年限之间的相关图;(2)计算平均年收入与受教育年限之间的相关系数;(3)在显著水平为5%时,检验平均年收入与受教育程度之间的线性相关程度是否显著;(4)求出平均年收入与受教育年限之间的回归方程,指出受教育年限为16年时,平均年收入是多少;(5)在显著水平为5%时,对回归参数进行显著性检验;(6)计算估计标准误差。[3]某年某地区24个工业企业的资料如下表所示:企业编号经济类型企业规模职工人数(人)全年总产值(万元)1国有企业中320035002国有企业大8500110003其他类型企业中240022004个体企业小3002005集体企业中80074006个体企业小1601207个体企业小80358集体企业小65309国有企业小1208010其他类型企业中1000120011集体企业中1800200012个体企业小40025013其他类型企业小1309414国有p业中900210015集体企业小27030016个体企业小46022017国有企业大56003000018国有企业大47002800019个体企业小30035020集体企业小28030021个体企业小16020022其他类型企业小20017023集体企业小1409724其他类型企业小90100试根据上述资料按经济类型和企业规模进行简单分组和复合分组,计算各组企业数、职工人数和总产值,并编制统计表。[4]某商品的外包装有4种不同颜色,分别为红、黄、绿和粉色。除不同颜色之外,其他诸如价格、重量等全部相同,现把这4种不同颜色的同一商品并排放在货架上,一段时间后,其销售情况如下:该商品的销售情况 单位:千克红色黄色绿色粉色7796778096827492869068868889828092887575要求,分析该商品的颜色是否对销售量有影响。[5]对方差已知的正态总体,问需要抽取容量n为多大的样本容量,才能使总体均值的置信水平为的置信区间的长度不大于L?[6]有甲、乙两台灌装机灌装瓶装可乐,从它们灌装好的瓶中随机抽取8瓶和6瓶,分别测得。假定两个总体服从正态分布,且方差相等,试问:甲、乙两台灌装机灌装的平均容量有无显著差异?[7]某企业集团公司2000年第三季度职工人数及产值资料如下: 7月8月9月10月销售产值(万元)400042004500-月初人数(人)4640466046804600要求:(1)编制第三季度各月劳动生产率的时间数列;(2)计算第三季度的月平均劳动生产率;(3)计算第三季度的劳动生产率。
下面一组数据中属于计量资料的是()A. 产品合格数B. 抽样的样品数C. 病人的治愈数D. 产品的合格率
某工人月工资1000元,则“工资”是( )A. 数量指标B. 质量指标C. 数量标志D. 品质标志
从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()。A. 简单随机抽样B. 分层抽样C. 系统抽样D. 整群抽样
6.在一批货物中随机抽取 80 件,发现有 11 件不合格品,试求这批货物的不合格品率的置信水平为 0.90 的置信区间.
10.截至2023年底,全国94个城市汽车保有量超过-|||-100万辆,与2022年相比增加10个城市,其中43-|||-个城市超200万辆,25个城市超300万辆,成都-|||-北京、重庆、上海、苏州等5个城市超过500万-|||-辆。(判断题)-|||-bigcirc A.正确-|||-bigcirc B.错误
判断题-|||-设随机变量X的分布律为:-|||-x -1 0 1-|||-pk 0.2 0.6 0.2-|||-F(x)为X的分布函数,则 F(0)=0.6 ()-|||-A.对-|||-B.错
在Excel中,制作统计图表所依据的数据源应当是( )。A. 一个数值数据B. 一个任意类型的数据C. 一组或若干组系列数值数据D. 若干组任意类型的数据
总体单位总量与总体标志总量,可以随研究对象的变化而发生变化。 ()A. 正确B. 错误
2022U1-96 某乡4万人,约1万户,欲抽其1/10 人口进行某病调查。随机抽取第1户,随后每隔4户抽取1户,抽到户的每个成员均进行调查。这种抽样方法称为A. 分层抽样B. 系统抽样C. 整群抽样D. 简单抽样E. 多级抽样
热门问题
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
5.聚类分析可以看作是一种非监督的分类。()
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小