题目

假设有数据属性取值(以递增序)为5,9,13,15,16,17,19,21,22,25,26,26,29,30,32,39,52。分别计算该列数的均值,中位数,众数,并粗略估计第一四分位数和第三四分位数,绘制该数据的箱线图。

题目解答

答案

首先，让我们按递增顺序排列数据属性的值：

5, 9, 13, 15, 16, 17, 19, 21, 22, 25, 26, 26, 29, 30, 32, 39, 52

现在，我们可以计算以下统计量：

1. 均值（平均值）：均值是所有数据值的总和除以数据点的数量。

均值 = (5 + 9 + 13 + 15 + 16 + 17 + 19 + 21 + 22 + 25 + 26 + 26 + 29 + 30 + 32 + 39 + 52) / 17 = 22.47（保留两位小数）

2. 中位数：中位数是数据集中值的位置。在有序数据集中，中位数是位于中间的值。由于数据集中有17个数据点，中位数是第9个数据点的值。

中位数 = 22

3. 众数：众数是数据集中出现最频繁的值。

众数 = 26（因为26出现两次，而其他值只出现一次）

4. 粗略估计第一四分位数和第三四分位数：四分位数是将数据集分成四等份的值。第一四分位数（Q1）是数据集的下四分之一点，而第三四分位数（Q3）是数据集的上四分之一点。可以通过位置估算它们，但由于数据集不是很大，我们可以通过观察来估计。

估计Q1 ≈ 16

估计Q3 ≈ 29

现在，我们可以绘制箱线图。箱线图显示了数据的五个统计量：最小值、Q1、中位数、Q3和最大值。

箱线图的绘制步骤如下：

1. 计算IQR（四分位距）：IQR = Q3 - Q1

2. 计算上界和下界：

- 上界 = Q3 + 1.5 * IQR

- 下界 = Q1 - 1.5 * IQR

3. 确定异常值：如果数据点低于下界或高于上界，则被视为异常值。

4. 绘制箱线图。

在这里，我们的估计值是：

- Q1 ≈ 16

- Q3 ≈ 29

所以，IQR = 29 - 16 = 13

上界 = 29 + 1.5 * 13 = 29 + 19.5 = 48.5

下界 = 16 - 1.5 * 13 = 16 - 19.5 = -3.5

没有数据点低于下界或高于上界，因此没有异常值。

下面是该数据集的箱线图：

```

+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+

| * * |

| * * * |

| | | * |

| * | | * * |

| | | * |

| | * | |

| | | |

+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+

```

箱线图的解释：

- 箱子的底边表示Q1（估计为16），顶边表示Q3（估计为29）。

- 箱子的中间线表示中位数（22）。

- 箱子的下边缘和上边缘表示最小值（5）和最大值（52）。

- 没有异常值，因此没有数据点在上界或下界之外。

这就是数据的箱线图和相应的统计量。

解析

步骤 1：计算均值
均值是所有数据值的总和除以数据点的数量。
步骤 2：计算中位数
中位数是数据集中值的位置。在有序数据集中，中位数是位于中间的值。
步骤 3：计算众数
众数是数据集中出现最频繁的值。
步骤 4：粗略估计第一四分位数和第三四分位数
四分位数是将数据集分成四等份的值。第一四分位数（Q1）是数据集的下四分之一点，而第三四分位数（Q3）是数据集的上四分之一点。
步骤 5：绘制箱线图
箱线图显示了数据的五个统计量：最小值、Q1、中位数、Q3和最大值。