8.设x为随机变量,E(X)=μ,D(X)=σ²,当()时,有E(Y)=0,D(Y)=1.单选题(5分)bigcircA.Y=σX+μbigcircB.Y=σX-μ●C.Y=(X-μ)/(σ)bigcircD.Y=(X-μ)/(σ^2)
若已知一份资料中,18名特征相同成年女子分两组用两种测量肺活量的仪器测最大呼吸率(L/min),比较两种方法检测结果有无差别,可进行A. 配对设计的Z检验B. 成组设计的t检验C. 配对设计的t检验D. 成组设计的Z检验E. q检验
为比较工人、干部中高血压患者所占比例是否不同,进行了X 2 检验,算得X 2 值为9.56,查表得X 2 (0.05,1)=3.84,若取α=0.05,应得出的结论是( )。A. 接受π1=π2B. 拒绝π1=π2C. 接受π1>π2D. 拒绝π1>π2E. 拒绝μ1=μ2
某建材的设计硬度为520~560kg/cm2,随机抽取100件样品,测得样本平均值()为530kg/cm2,标准偏差(s)为6.2kg/cm2。试求该制造过程的能力指数,并判断过程能力等级和给出后续措施。
33)【判断题】(1分)PCA原理中,找出第一个主成分的方向,也就是数据方差最大的方向。A. 对B. 错
调查对象确定的主要依据A. 调查目的B. 调查范围C. 划清总体同质范围D. 调查方法E. 调查时间
某研究员研究某地 500 名 8 岁男孩的体重和肺活量,为了分析肺活量和体重的关系,适宜用什么图A. 散点图B. 条图C. 点图D. 圆图E. 线图
简述统计调查方案包括的内容。
第2章统计数据的描述练习题部分:2.1 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(2) 用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。2.2 某行业管理局所属40个企业2008年的产品销售收入数据如下(单位:万元):(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。2.3 某百货公司连续40天的商品销售额如下(单位:万元):根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。2.4 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。2.5 下面是北方某城市1~2月份各天气温的记录数据:(1) 对上面的数据进行适当的分组;(2) 绘制直方图,说明该城市气温分布的特点。2.6 下面是某考试管理中心对2007年参加成人自学考试的12000名学生的年龄分组数据:(1) 对这个年龄分布作直方图;(2) 从直方图分析成人自学考试人员年龄分布的特点。2.7 下面是A、B两个班学生的数学考试成绩数据:A班:B班:年龄18~1921~2122~2425~2930~3435~3940~4445~59%1.934.734.117.26.42.71.81.2(1) 将两个班的考试成绩用一个公共的茎制成茎叶图;(2) 比较两个班考试成绩分布的特点。2.8 1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。资料来源:《中国统计年鉴1998》,中国统计出版社1998,第10页。2.9 某百货公司6月份各天的销售额数据如下(单位:万元):4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。2.10 甲乙两个企业生产三种产品的单位成本和总成本资料如下:比较哪个企业的总平均成本高?并分析其原因。2.11 在某地区抽取的120家企业按利润额进行分组,结果如下:计算120家企业利润额的均值和标准差。2.12 一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?(2.以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?(4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?2.13 对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?(2)比较分析哪一组的身高差异大?2.14 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):(1) 你准备采用什么方法来评价组装方法的优劣?(2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。2.15 在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。(1)你认为该用什么样的统计测度值来反映投资的风险?(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票? -30 0 30 60 -30 0 30 60收益率收益率(a)商业类股票 (b) 高科技类股票2.16 下图给出了2000年美国人口年龄的金字塔,其绘制方法及其数字说明与[例2.10]相同,试对该图反映的人口、政治、社会、经济状况进行分析。
多项式回归可以用来:()A. 对非线性关系的数据进行建模B. 分析数据中的相关性C. 对数据进行异常检测D. 进行特征选择
热门问题
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5.聚类分析可以看作是一种非监督的分类。()
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度