第4章 抽样与抽样分布练习:4.1 一个具有个观察值的随机样本抽自于均值等于20、标准差等于16的总体。⑴ 给出的抽样分布(重复抽样)的均值和标准差⑵ 描述的抽样分布的形状。你的回答依赖于样本容量吗?⑶ 计算标准正态统计量对应于的值。⑷ 计算标准正态统计量对应于的值。(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。2.5 下面是北方某城市1~2月份各天气温的记录数据:-32-4-7-11-1789-6-7-14-18-15-9-6-15-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-6-15-4-9-3-32-4-4-16-175-6-5(1) 指出上面的数据属于什么类型;(2) 对上面的数据进行适当的分组;(3) 绘制直方图,说明该城市气温分布的特点。2.6 下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:年龄18~1921~2122~2425~2930~3435~3940~4445~59%1.934.734.117.26.42.71.81.2(1) 对这个年龄分布作直方图;(2) 从直方图分析成人自学考试人员年龄分布的特点。2.7 下面是A、B两个班学生的数学考试成绩数据:A班:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100(1) 将两个班的考试成绩用一个公共的茎制成茎叶图;(2) 比较两个班考试成绩分布的特点。2.8 1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。月份北京长春南京郑州武汉广州成都昆明兰州西安149707657777279655167241687157758083654167347507768818081584974450397267758479614670555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104759755372807876456511665982777872787153731256578265827582715272资料来源:《中国统计年鉴1998》,中国统计出版社1998,第10页。4.2 参考练习4.1求概率。⑴<16; ⑵>23; ⑶>25; ⑷.落在16和22之间; ⑸<14。4.3 一个具有个观察值的随机样本选自于、的总体。试求下列概率的近似值:4.4 一个具有个观察值的随机样本选自于和的总体。⑴ 你预计的最大值和最小值是什么?⑵ 你认为至多偏离多么远?⑶ 为了回答b你必须要知道吗?请解释。4.5 考虑一个包含的值等于0,1,2,…,97,98,99的总体。假设的取值的可能性是相同的。则运用计算机对下面的每一个值产生500个随机样本,并对于每一个样本计算。对于每一个样本容量,构造的500个值的相对频率直方图。当值增加时在直方图上会发生什么变化?存在什么相似性?这里和。4.6 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。⑴ 描述(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明服从怎样的分布以及的均值和方差是什么?证明你的回答;⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之间的概率呢?4.7 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为克、标准差为克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量。(1)描述的抽样分布,并给出和的值,以及概率分布的形状;(3) 假设某一天技术人员观察到,这是否意味着装袋过程出现问题了呢,为什么?4.8 在本章的统计实践中,某投资者考虑将1000美元投资于种不同的股票。每一种股票月收益率的均值为,标准差。对于这五种股票的投资组合,投资者每月的收益率是。投资者的每月收益率的方差是,它是投资者所面临风险的一个度量。⑴ 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的风险将会增加还是减少?请解释;⑵ 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,并与只投资5种股票的情形进行比较。4.9 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。⑴ 如果该生产过程仍旧正常,则的样本分布为何?2.9 某百货公司6月份各天的销售额数据如下(单位:万元):(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。2.10 甲乙两个企业生产三种产品的单位成本和总成本资料如下:比较哪个企业的总平均成本高?并分析其原因。2.11 在某地区抽取的120家企业按利润额进行分组,结果如下:计算120家企业利润额的均值和标准差。2.12 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同?(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?2.13 一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?(2.以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,样本均值≤830牛顿的概率是多少?⑶ 在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现状有何看法(即夹克级别均值是否仍为840牛顿)?⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛顿。在这种情况下的抽样分布是什么?当具有这种分布时,则≤830牛顿的概率是多少?4.10 在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值描绘在下图中。假设这个过程是在统计控制中的,则的分布将具有过程的均值,标准差具有过程的标准差除以样本容量的平方根,。下面的控制图中水平线表示过程均值,两条线称为控制极限度,位于的上下3的位置。假如落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从和的近似的正态分布。⑴ 假设则上下控制极限应距离多么远?⑵ 假如这个过程是在控制中,则落在控制极限之外的概率是多少?⑶ 假设抽取样本之前,过程均值移动到,则由样本得出这个过程失控的(正确的)结论的概率是多少?4.11 参考练习4.10.肥皂公司决定设置比练习4.10中所述的这一限度更为严格的控制极限。特别地,当加工过程在控制中时,公司愿意接受落在控制极限外面的概率是0.10。⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的样本中使用个观察值,则控制极限应该设定在哪里?⑵ 假设a部分中的控制极限已付诸实施,但是公司不知道,现在是3%(而不是2%)。若,则落在控制极限外面的概率是多少?若呢?4.12 参考练习4.11。为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。警戒限一般被设定为。假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。⑴ 假设肥皂加工过程是在控制中(即,它遵循和的正态分布),则的下一个值落在警戒限之外的概率是什么?⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的的这40个值中有多少个点落在上控制极限以上?⑶ 假设肥皂加工过程是在控制中,则的两个未来数值落在下警戒线以下的概率是多少?
第4章 抽样与抽样分布练习:
4.1 一个具有个观察值的随机样本抽自于均值等于20、标准差等于16的总体。⑴ 给出的抽样分布(重复抽样)的均值和标准差⑵ 描述的抽样分布的形状。你的回答依赖于样本容量吗?⑶ 计算标准正态统计量对应于的值。⑷ 计算标准正态统计量对应于的值。(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。
2.5 下面是北方某城市1~2月份各天气温的记录数据:-32-4-7-11-1789-6-7-14-18-15-9-6-15-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-6-15-4-9-3-32-4-4-16-175-6-5(1) 指出上面的数据属于什么类型;(2) 对上面的数据进行适当的分组;(3) 绘制直方图,说明该城市气温分布的特点。
2.6 下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:年龄18~1921~2122~2425~2930~3435~3940~4445~59%
1.93
4.73
4.11
7.2
6.4
2.7
1.8
1.2(1) 对这个年龄分布作直方图;(2) 从直方图分析成人自学考试人员年龄分布的特点。
2.7 下面是A、B两个班学生的数学考试成绩数据:A班:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100(1) 将两个班的考试成绩用一个公共的茎制成茎叶图;(2) 比较两个班考试成绩分布的特点。
2.8 1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。月份北京长春南京郑州武汉广州成都昆明兰州西安149707657777279655167241687157758083654167347507768818081584974450397267758479614670555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104759755372807876456511665982777872787153731256578265827582715272资料来源:《中国统计年鉴1998》,中国统计出版社1998,第10页。
4.2 参考练习4.1求概率。⑴<16; ⑵>23; ⑶>25; ⑷.落在16和22之间; ⑸<14。
4.3 一个具有个观察值的随机样本选自于、的总体。试求下列概率的近似值:
4.4 一个具有个观察值的随机样本选自于和的总体。⑴ 你预计的最大值和最小值是什么?⑵ 你认为至多偏离多么远?⑶ 为了回答b你必须要知道吗?请解释。
4.5 考虑一个包含的值等于0,1,2,…,97,98,99的总体。假设的取值的可能性是相同的。则运用计算机对下面的每一个值产生500个随机样本,并对于每一个样本计算。对于每一个样本容量,构造的500个值的相对频率直方图。当值增加时在直方图上会发生什么变化?存在什么相似性?这里和。
4.6 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。⑴ 描述(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明服从怎样的分布以及的均值和方差是什么?证明你的回答;⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之间的概率呢?
4.7 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为克、标准差为克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量。(1)描述的抽样分布,并给出和的值,以及概率分布的形状;(3) 假设某一天技术人员观察到,这是否意味着装袋过程出现问题了呢,为什么?
4.8 在本章的统计实践中,某投资者考虑将1000美元投资于种不同的股票。每一种股票月收益率的均值为,标准差。对于这五种股票的投资组合,投资者每月的收益率是。投资者的每月收益率的方差是,它是投资者所面临风险的一个度量。⑴ 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的风险将会增加还是减少?请解释;⑵ 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,并与只投资5种股票的情形进行比较。
4.9 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。⑴ 如果该生产过程仍旧正常,则的样本分布为何?
2.9 某百货公司6月份各天的销售额数据如下(单位:万元):(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
2.10 甲乙两个企业生产三种产品的单位成本和总成本资料如下:比较哪个企业的总平均成本高?并分析其原因。
2.11 在某地区抽取的120家企业按利润额进行分组,结果如下:计算120家企业利润额的均值和标准差。
2.12 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同?(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?
2.13 一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?(
2.以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,样本均值≤830牛顿的概率是多少?⑶ 在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现状有何看法(即夹克级别均值是否仍为840牛顿)?⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛顿。在这种情况下的抽样分布是什么?当具有这种分布时,则≤830牛顿的概率是多少?
4.10 在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值描绘在下图中。假设这个过程是在统计控制中的,则的分布将具有过程的均值,标准差具有过程的标准差除以样本容量的平方根,。下面的控制图中水平线表示过程均值,两条线称为控制极限度,位于的上下3的位置。假如落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从和的近似的正态分布。⑴ 假设则上下控制极限应距离多么远?⑵ 假如这个过程是在控制中,则落在控制极限之外的概率是多少?⑶ 假设抽取样本之前,过程均值移动到,则由样本得出这个过程失控的(正确的)结论的概率是多少?
4.11 参考练习4.1
0.肥皂公司决定设置比练习4.10中所述的这一限度更为严格的控制极限。特别地,当加工过程在控制中时,公司愿意接受落在控制极限外面的概率是0.10。⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的样本中使用个观察值,则控制极限应该设定在哪里?⑵ 假设a部分中的控制极限已付诸实施,但是公司不知道,现在是3%(而不是2%)。若,则落在控制极限外面的概率是多少?若呢?
4.12 参考练习4.11。为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。警戒限一般被设定为。假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。⑴ 假设肥皂加工过程是在控制中(即,它遵循和的正态分布),则的下一个值落在警戒限之外的概率是什么?⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的的这40个值中有多少个点落在上控制极限以上?⑶ 假设肥皂加工过程是在控制中,则的两个未来数值落在下警戒线以下的概率是多少?
题目解答
答案
答案