题目
已知动脉硬化患者载脂蛋白B的含量呈明显偏态分布,描述其个体差异的统计指标应使用( )A. 全距B. 标准差C. 变异系数D. 方差E. 四分位数间距
已知动脉硬化患者载脂蛋白B的含量呈明显偏态分布,描述其个体差异的统计指标应使用( )
A. 全距
B. 标准差
C. 变异系数
D. 方差
E. 四分位数间距
题目解答
答案
E. 四分位数间距
解析
考查要点:本题主要考查偏态分布数据离散程度的描述指标选择。
解题核心:偏态分布数据不适合使用基于均值的指标(如标准差、方差),而应选择稳健的统计量。
关键点:
- 偏态分布的数据中,均值受极端值影响较大,因此相关指标(如标准差、方差、变异系数)可靠性降低。
- 四分位数间距(IQR)反映中间50%数据的范围,不受极端值影响,适合描述偏态分布的离散程度。
偏态分布的特点是数据不对称,存在长尾。此时:
- 全距(A):仅考虑最大值和最小值,易受极端值影响,信息量少。
- 标准差(B)和方差(D):依赖均值计算,偏态下均值不稳定,导致这些指标不可靠。
- 变异系数(C):是标准差与均值的比值,同样受偏态影响。
- 四分位数间距(E):通过上四分位数(Q₃)和下四分位数(Q₁)计算(IQR = Q₃ - Q₁),反映中间50%数据的波动范围,稳健且适合偏态分布。
结论:偏态分布时,应优先选择四分位数间距描述个体差异。