logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?缺水量 ^8(m)^3-|||-o 上广南北武关成比重 乐 城市-|||-海州京京汉津都帘庆-|||-2000年全国主要城市中-|||-缺水情况排在前10位的城市很明显,如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.由于城市住户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样,我们获得了100位居民某年的月均用水量(单位:t):缺水量 ^8(m)^3-|||-o 上广南北武关成比重 乐 城市-|||-海州京京汉津都帘庆-|||-2000年全国主要城市中-|||-缺水情况排在前10位的城市上面这些数字能告诉我们什么呢?很容易发现的是一个居民月均用水量的最小值是0.2 t,最大值是4.3 t,其他在0.2~4.3 t之间.除此之外,很难发现这100位居民的用水量的其他信息了.实际上,我们很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理与分析.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布(frequency distribution)情况.具体的做法如下.1.求极差(即一组数据中最大值与最小值的差)例如,4.3-0.2=4.1,说明样本数据的变化范围是4.1 t.2.决定组距与组数组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么 (a1x+b1y=c1,①a2x+b2y=c2,② ,因此可以将数据分为9组.这个组数是较合适的.于是取组距为0.5,组数为9.3.将数据分组以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5].4.列频率分布表计算各小组的频率,作出下面的频率分布表.缺水量 ^8{m)^3-|||-o 上广南北武关成比重 乐 城市-|||-海州京京汉津都帘庆-|||-2000年全国主要城市中-|||-缺水情况排在前10位的城市表2-2的最后一列是各小组的频率,例如第一小组的频率是: a1b2−a2b1≠0 .5.画频率分布直方图根据表2-2可以得到如图.2-1所示的频率分布直方图.缺水量 ^8(m)^3-|||-o 上广南北武关成比重 乐 城市-|||-海州京京汉津都帘庆-|||-2000年全国主要城市中-|||-缺水情况排在前10位的城市图.2-1中,横轴表示月均用水量,纵轴表示频率/组距.由于 小长方形的面积 a2a1 ,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.容易知道,在频率分布直方图中,各小长方形的面积的总和等于1.表2-2和图.2-1显示了样本数据落在各个小组的比例大小.从中我们可以看到,月均用水量在区间[2,2.5)内的居民最多,在[1.5,2)内的次之,大部分居民的月均用水量都在[1,3)之间.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.例如,从图.2-1可以清楚地看到,居民月均用水量的分布是“山峰”状的,而且是“单峰”的,另外还有一定的对称性,这说明,大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少.但是,直方图也丢失了一些信息,例如,原始数据不能在图中表示出来.根据样本数据的频率分布,我们就可以推测这一城市全体居民月均用水量分布的大致情况.也就是根据样本的频率分布,我们可以大致估计出总体的分布.因为这种估计是以一定的统计调查为依据的,所以据此给市政府提出每位居民月用水量标准的建议,就具有较强的说服力了.如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图.2-1,你能对制定月用水量标准提出建议吗?

我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?

很明显,如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.

由于城市住户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样,我们获得了100位居民某年的月均用水量(单位:t):

上面这些数字能告诉我们什么呢?很容易发现的是一个居民月均用水量的最小值是0.2 t,最大值是4.3 t,其他在0.2~4.3 t之间.除此之外,很难发现这100位居民的用水量的其他信息了.实际上,我们很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理与分析.

分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.

初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布(frequency distribution)情况.具体的做法如下.

1.求极差(即一组数据中最大值与最小值的差)

例如,

4.3-0.2=4.1,

说明样本数据的变化范围是4.1 t.

2.决定组距与组数

组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5~12组.

为方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么

{a1x+b1y=c1,①a2x+b2y=c2,② ,

因此可以将数据分为9组.这个组数是较合适的.于是取组距为0.5,组数为9.

3.将数据分组

以组距为0.5将数据分组时,可以分成以下9组:

[0,0.5),[0.5,1),…,[4,4.5].

4.列频率分布表

计算各小组的频率,作出下面的频率分布表.

表2-2的最后一列是各小组的频率,例如第一小组的频率是:

a1b2−a2b1≠0 .

5.画频率分布直方图

根据表2-2可以得到如图.2-1所示的频率分布直方图.

图.2-1中,横轴表示月均用水量,纵轴表示频率/组距.由于

小长方形的面积  a2a1 ,

所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.

容易知道,在频率分布直方图中,各小长方形的面积的总和等于1.

表2-2和图.2-1显示了样本数据落在各个小组的比例大小.从中我们可以看到,月均用水量在区间[2,2.5)内的居民最多,在[1.5,2)内的次之,大部分居民的月均用水量都在[1,3)之间.

直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.例如,从图.2-1可以清楚地看到,居民月均用水量的分布是“山峰”状的,而且是“单峰”的,另外还有一定的对称性,这说明,大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少.但是,直方图也丢失了一些信息,例如,原始数据不能在图中表示出来.

根据样本数据的频率分布,我们就可以推测这一城市全体居民月均用水量分布的大致情况.也就是根据样本的频率分布,我们可以大致估计出总体的分布.因为这种估计是以一定的统计调查为依据的,所以据此给市政府提出每位居民月用水量标准的建议,就具有较强的说服力了.

如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图.2-1,你能对制定月用水量标准提出建议吗?

题目解答

答案

解:

由频率分布表及频率分布直方图知月用水量不超过3t的用户的频率为

0.04+0.08+0.15+0.25+0.25+0.14=0.88>85%,所以可建议月用水量标准为3t.

由统计图表正确估计出月用水量不超过3t的用户的频率是解答该题的关键.

相关问题

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 假设某地正常男性体重服从正态分布,随机抽取某地正常男性100测量其体重,结果=60.0Kg,S=6.0Kg。请计算:(1)该地正常男子体重95%总体均数的可信区间。(2)该地男子95%的体重范围为多少?

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

  • 下列关于回归分析的描述不正确的是()A. 回归分析研究单个变量的变化情况B. 刻画不同变量之间关系的模型统称为线性回归模型C. 回归分析研究不同变量之间存在的关系D. 回归分析模型可分为线性回归模型和非线性回归模型

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • 设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号