题目
一、单选题(共15题,30.0分)2.(单选题,2.0分)在数据分析中,描述性统计通常包括哪些指标?A 平均值、中位数、标准差B 方差、协方差、相关系数C 峰度、偏度、频率D 置信区间、假设检验、p值
一、单选题(共15题,30.0分)
2.(单选题,2.0分)
在数据分析中,描述性统计通常包括哪些指标?
A 平均值、中位数、标准差
B 方差、协方差、相关系数
C 峰度、偏度、频率
D 置信区间、假设检验、p值
题目解答
答案
A
解析
本题考查描述性统计所包含的指标相关知识。解题思路是明确描述性统计的定义和作用,然后分析每个选项中的指标是否属于描述性统计的范畴。
- 选项A:
- 平均值是一组数据的总和除以数据个数,它反映了数据的集中趋势。例如,对于数据$x_1,x_2,\cdots,x_n$,平均值$\bar{x}=\frac{1}{n}\sum_{i = 1}^{n}x_i$。
- 中位数是将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数为中位数;如果数据的个数是偶数,则中间两个数据的平均数为中位数。它也是衡量数据集中趋势的指标。
- 标准差是方差的平方根,它衡量了数据相对于平均值的离散程度。方差$s^2=\frac{1}{n - 1}\sum_{i = 1}^{n}(x_i-\bar{x})^2$,标准差$s = \sqrt{\frac{1}{n - 1}\sum_{i = 1}^{n}(x_i-\bar{x})^2}$。所以平均值、中位数、标准差都属于描述性统计指标。
- 选项B:
- 方差和标准差类似,是衡量数据离散程度的指标。
- 协方差用于衡量两个变量的总体误差,相关系数是协方差的标准化形式,用于衡量两个变量之间的线性相关程度。它们主要用于研究变量之间的关系,不属于描述性统计中对单一数据集特征描述的指标。
- 选项C:
- 峰度是描述数据分布形态陡峭或平坦程度的统计量。
- 偏度是描述数据分布不对称程度的统计量。
- 频率是指某个数值在数据集中出现的次数与总次数的比值。虽然峰度和偏度是描述数据分布特征的指标,但频率通常用于构建频率分布表,它本身不是描述性统计的核心指标。
- 选项D:
- 置信区间是指由样本统计量所构造的总体参数的估计区间。
- 假设检验是先对总体参数或分布形式提出某种假设,然后利用样本信息来判断原假设是否成立的一种统计推断方法。
- $p$值是在假设检验中用于判断是否拒绝原假设的一个概率值。它们都属于推断性统计的内容,而不是描述性统计。