题目
已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用A. 全距B. 标准差C. 变异系数D. 方差E. 四分位数间距
已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用
A. 全距
B. 标准差
C. 变异系数
D. 方差
E. 四分位数间距
题目解答
答案
E. 四分位数间距
解析
考查要点:本题主要考查偏态分布数据离散程度的描述指标选择。
解题核心:明确不同统计指标的适用条件,尤其是数据分布类型对指标选择的影响。
关键点:
- 偏态分布的数据中,均值和标准差易受极端值影响,稳定性差;
- 四分位数间距(IQR)反映中间50%数据的范围,不受极端值干扰,适用于偏态分布;
- 全距、标准差、方差、变异系数均依赖数据整体分布或均值,对偏态数据可靠性低。
偏态分布的特点是数据不对称,存在长尾。此时:
- 全距(A)仅考虑最大值和最小值,易受异常值影响,信息量有限;
- 标准差(B)和方差(D)基于均值计算,对极端值敏感,可靠性低;
- 变异系数(C)是标准差与均值的比值,同样依赖均值,适用性差;
- 四分位数间距(E)通过上四分位数(Q₃)和下四分位数(Q₁)的差(IQR = Q₃ - Q₁),反映中间50%数据的集中程度,不受偏态和异常值影响,是偏态分布的最优选择。