在组距数列中,组中值是( )。A. 组平均数B. 用来代表各组标志值的平均水平C. 在开放式分组中,可以参照相邻组的组距来确定D. 在开放式分组中值无法确定E. 上限和下限之间的中点数值
下列双变量中,适合于进行线性相关分析的是()A. 年龄与身高B. 体重与体表面积C. 母亲文化水平与子女的智商D. 父亲身高与子女身高E. 是否参加科研项目与科研能力得分
假设检验水准a指的是()A. 检验的置信度B. 控制I类错误的概率C. 控制Ⅱ类错误的概率D. 无效假设的概率E. 备择假设的概率
15、频数分析主要是通过数据统计量对数据进行分析,例如四分位数是把所有的数值由小到大排列分成四等份,处于()上的数值就是四分位数。
养牛场原有30头大牛和15头小牛,1天约用饲料675kg,一周后又购进12头大牛和5头小牛,这时1天约用饲料940kg,饲养员李大叔估计每头大牛1天约需饲料18~20kg,每头小牛1天约需饲料7~8kg,你能否通过计算检验他的估计?
33)【判断题】(1分)PCA原理中,找出第一个主成分的方向,也就是数据方差最大的方向。A. 对B. 错
描述某年某医院肺结核、冠心病和肿瘤病死率的统计图为( )。A. 直方图B. 单式直条图C. 复式直条图D. 百分比条图
第2章统计数据的描述练习题部分:2.1 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(2) 用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。2.2 某行业管理局所属40个企业2008年的产品销售收入数据如下(单位:万元):(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。2.3 某百货公司连续40天的商品销售额如下(单位:万元):根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。2.4 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。2.5 下面是北方某城市1~2月份各天气温的记录数据:(1) 对上面的数据进行适当的分组;(2) 绘制直方图,说明该城市气温分布的特点。2.6 下面是某考试管理中心对2007年参加成人自学考试的12000名学生的年龄分组数据:(1) 对这个年龄分布作直方图;(2) 从直方图分析成人自学考试人员年龄分布的特点。2.7 下面是A、B两个班学生的数学考试成绩数据:A班:B班:年龄18~1921~2122~2425~2930~3435~3940~4445~59%1.934.734.117.26.42.71.81.2(1) 将两个班的考试成绩用一个公共的茎制成茎叶图;(2) 比较两个班考试成绩分布的特点。2.8 1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。资料来源:《中国统计年鉴1998》,中国统计出版社1998,第10页。2.9 某百货公司6月份各天的销售额数据如下(单位:万元):4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。2.10 甲乙两个企业生产三种产品的单位成本和总成本资料如下:比较哪个企业的总平均成本高?并分析其原因。2.11 在某地区抽取的120家企业按利润额进行分组,结果如下:计算120家企业利润额的均值和标准差。2.12 一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?(2.以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?(4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?2.13 对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?(2)比较分析哪一组的身高差异大?2.14 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):(1) 你准备采用什么方法来评价组装方法的优劣?(2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。2.15 在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。(1)你认为该用什么样的统计测度值来反映投资的风险?(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票? -30 0 30 60 -30 0 30 60收益率收益率(a)商业类股票 (b) 高科技类股票2.16 下图给出了2000年美国人口年龄的金字塔,其绘制方法及其数字说明与[例2.10]相同,试对该图反映的人口、政治、社会、经济状况进行分析。
若已知一份资料中,18名特征相同成年女子分两组用两种测量肺活量的仪器测最大呼吸率(L/min),比较两种方法检测结果有无差别,可进行A. 配对设计的Z检验B. 成组设计的t检验C. 配对设计的t检验D. 成组设计的Z检验E. q检验
第2章 线性回归模型的基本思想与最小二乘法2.1 总体回归函数(PRF)与样本回归函数(SRF)有何区别?答:总体回归函数和样本回归函数的区别是:总体回归函数准确地描述了某种状态下或某个范围内变量之间客观存在的关系,但一般是未知的,而样本回归函数是对总体回归函数的近似,是利用样本数据计算得到的。2.2 拟合优度[1]的含义是什么?答:拟合优度是回归直线对观测值的拟合程度,它的直观含义是因变量的变动能被自变量解释的比例。其定义是,。的值越接近1,说明回归直线对观测值的拟合程度越好,反之,的值越接近0,说明回归直线对观测值的拟合程度越差。2.3 误差与残差有何区别?答:残差指真实值与由样本回归函数所得的估计值的差,而误差是真实值与由总体回归函数所得的估计值的差。2.4 以下是某城市10个市场苹果需求()和价格()的数据:(1)计算。(2)假设(y)^2, ∑x^2,∑xy,计算系数的OLS估计量。(3)做出散点图和样本回归线(利用统计软件)。(4)估计苹果在本均值点的需求弹性()。答:(1)(y)^2, ∑x^2,∑xy(y)^2, ∑x^2,∑xy(y)^2, ∑x^2,∑xy(y)^2, ∑x^2,∑xy(y)^2, ∑x^2,∑xy这个数值有误,答案是 -143.6(2)(y)^2, ∑x^2,∑xy 有误,答案为 -5.203(y)^2, ∑x^2,∑xy 有误,答案为203.21(3)散点图和样本回归线如下图所示:(4) 答案应为-1.628也就是说当价格变动1时,需求将反向变动1.997。2.5 DATA1-1给出了中国2011年各省市GDP((y)^2, ∑x^2,∑xy)和投资()的数据。利用统计软件(Eviews或Stata)回答以下问题:(1)做散点图,观察投资对GDP的影响。(2)估计回归方程(y)^2, ∑x^2,∑xy。(3)你如何解释斜率系数的含义?答:(1)散点图如下:(2)以下是用eviews6.0输出的结果,可知:,即为所要求的估计回归方程。(3)斜率系数是指当投资变动1单位时,GDP将变动1.832478单位。另外,,这表明投资对GDP有正相关关系。而,表明投资的小幅度变动,将引起GDP更大幅度的变动,也就是说投资变动将引起较大的GDP变动。2.6 DATA2-2给出了美国1996-2006年GDP((y)^2, ∑x^2,∑xy)与城市失业率()的数据。利用统计软件回答以下问题:(1)估计(y)^2, ∑x^2,∑xy的变动(失业率增量:百分数)对(y)^2, ∑x^2,∑xy的变化率(经济增长率:百分数)的回归方程。(2)提取自变量的系数,你有什么发现?提示:研究奥肯定律。奥肯定律是指:经济增长超过潜在的经济增长水平的增量每提升一定幅度时,失业率将下降一个百分点。 答:(1)根据eviews6.0输出结果得到估计方程为:(y)^2, ∑x^2,∑xy(2)由(1)中所求的方程可以知道斜率,可知当GDP变动1个百分点时,失业率将反向变动0.0373个百分点。这很符合奥肯定律。 2.7 假设一元回归方程中的截距项为零,即,利用最小二乘法的思想计算斜率系数的估计量。计算及其估计量。答:(y)^2, ∑x^2,∑xy,残差平方和,两边对求导数,并令其为零:(y)^2, ∑x^2,∑xy,求得(y)^2, ∑x^2,∑xy从而(y)^2, ∑x^2,∑xy2.8 证明:因变量(y)^2, ∑x^2,∑xy对自变量(y)^2, ∑x^2,∑xy回归的拟合优度等于和的(样本)相关系数的平方,即,其中是和的(样本)相关系数。答:证明:(y)^2, ∑x^2,∑xy2.9 采用正文中的记号,试证明:(y)^2, ∑x^2,∑xy
热门问题
5.聚类分析可以看作是一种非监督的分类。()
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100