题目
为了解某地区铅污染的情况,抽样收集了130人的尿铅值,经分析发现数据为偏态分布。若要对数据进行描述,应选择集中趋势和离散程度的指标为()。A. 中位数和标准差B. 中位数和极差C. 中位数和四分位间距D. 算术均数和标准差E. 算术均数和四分位间距
为了解某地区铅污染的情况,抽样收集了130人的尿铅值,经分析发现数据为偏态分布。若要对数据进行描述,应选择集中趋势和离散程度的指标为()。
A. 中位数和标准差
B. 中位数和极差
C. 中位数和四分位间距
D. 算术均数和标准差
E. 算术均数和四分位间距
题目解答
答案
C. 中位数和四分位间距
解析
考查要点:本题主要考查对偏态分布数据描述指标的选择,需结合集中趋势和离散程度的适用性进行判断。
解题核心思路:
- 偏态分布数据中,算术均数易受极端值影响,因此集中趋势应选择中位数。
- 离散程度指标需选择稳健性好的方法,四分位间距(IQR)能反映中间50%数据的范围,不受极端值干扰,优于标准差和极差。
破题关键点:
- 明确偏态分布与正态分布的差异,排除基于均数的指标(如标准差)。
- 理解不同离散程度指标的特点,优先选择四分位间距。
偏态分布的数据通常不对称,存在极端值,此时:
-
集中趋势:
- 算术均数会受偏态影响,无法准确代表数据集中位置。
- 中位数是有序数据的中间值,不受极端值影响,更适合作为集中趋势的指标。
-
离散程度:
- 标准差和方差依赖均数计算,易受偏态干扰。
- 极差仅考虑最大值与最小值,信息量有限且不稳定。
- 四分位间距(IQR)是上四分位数(Q₃)与下四分位数(Q₁)的差,反映中间50%数据的分布范围,稳健性高,适合偏态数据。
综上,正确答案为中位数和四分位间距(选项C)。