题目
为了解某地区铅污染的情况,抽样收集了130人的尿铅值,经分析发现数据为偏态分布。若要对数据进行描述,应选择集中趋势和离散程度的指标为( )A. 中位数和标准差B. 中位数和极差C. 中位数和四分位间距D. 算术均数和标准差E. 算术均数和四分位间距
为了解某地区铅污染的情况,抽样收集了130人的尿铅值,经分析发现数据为偏态分布。若要对数据进行描述,应选择集中趋势和离散程度的指标为( )
A. 中位数和标准差
B. 中位数和极差
C. 中位数和四分位间距
D. 算术均数和标准差
E. 算术均数和四分位间距
题目解答
答案
C. 中位数和四分位间距
解析
本题考查知识点为偏态分布数据集中趋势和离散程度指标的选择。解题思路是先明确不同分布类型下集中趋势和离散程度指标的适用情况,再根据题目中数据为偏态分布这一条件来确定合适的指标。
集中趋势指标的选择
- 算术均数:它是一组数据的总和除以数据个数所得的结果,适用于对称分布,尤其是正态分布的数据。因为在正态分布中,数据围绕均数对称分布,均数能很好地代表数据的中心位置。
- 中位数:是将一组数据按从小到大的顺序排列后,位于中间位置的数值。对于偏态分布的数据,由于数据分布不对称,存在极端值,算术均数会受到极端值的影响而偏离数据的中心位置,而中位数不受极端值的影响,能更稳定地反映数据的集中趋势。所以对于偏态分布的数据,应选择中位数来描述集中趋势。
离散程度指标的选择
- 标准差:它是方差的平方根,反映了数据相对于均数的离散程度。标准差的计算依赖于均数,同样会受到极端值的影响。在偏态分布中,极端值会使标准差增大,不能准确地反映数据的离散情况。
- 极差:是一组数据中的最大值与最小值之差,它只考虑了两个极端值,没有考虑中间数据的分布情况,容易受到极端值的影响,不能很好地反映数据的整体离散程度。
- 四分位间距:是上四分位数($Q_3$)与下四分位数($Q_1$)之差,即$IQR = Q_3 - Q_1$。它反映了中间50%数据的离散程度,不受极端值的影响,能更准确地描述偏态分布数据的离散情况。所以对于偏态分布的数据,应选择四分位间距来描述离散程度。
综上,对于偏态分布的数据,应选择中位数来描述集中趋势,选择四分位间距来描述离散程度。