题目
已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用( )A. 全距B. 标准差C. 四分位数间距D. 方差
已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用( )
A. 全距
B. 标准差
C. 四分位数间距
D. 方差
题目解答
答案
C. 四分位数间距
解析
考查要点:本题主要考查偏态分布数据离散程度的描述指标选择。
解题核心:明确不同离散程度指标的适用条件。
关键点:
- 偏态分布的数据中,均值和标准差的稳定性较差,容易受极端值影响。
- 四分位数间距(IQR)基于中位数位置的分位数计算,能有效反映数据中间50%的集中范围,且不受极端值干扰,适用于偏态分布。
- 全距、标准差、方差均依赖数据对称性和均值,对偏态数据的描述不够准确。
偏态分布的特点是数据不对称,存在长尾。此时:
- 全距(A)仅考虑最大值和最小值,易受异常值影响,且无法反映中间数据的分布情况。
- 标准差(B)和方差(D)均基于均值计算,而偏态分布下均值本身可能偏离数据集中趋势,导致这些指标可靠性降低。
- 四分位数间距(C)通过计算上四分位数(Q₃)与下四分位数(Q₁)的差(IQR = Q₃ - Q₁),聚焦于数据中间50%的范围,能有效描述偏态数据的离散程度,且稳健性高。
结论:偏态分布应优先选择四分位数间距。