题目
【计算题】假定用于分析的数据包含属性 age,数据元组[1]中 age 的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70 (1)使用 min-max 规范化[2],将 age 值 35 转换到[0.0,1.0]区间 (2)使用 z-score 规范化转换 age 值 35,其中,age 的标准偏差为 12.94 年 (3)使用小数定标规范化转换 age 值 35
【计算题】假定用于分析的数据包含属性 age,数据元组[1]中 age 的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70 (1)使用 min-max 规范化[2],将 age 值 35 转换到[0.0,1.0]区间 (2)使用 z-score 规范化转换 age 值 35,其中,age 的标准偏差为 12.94 年 (3)使用小数定标规范化转换 age 值 35
题目解答
答案
(1)已知最大值为 70,最小值为 13,则可将 35 规范化为 (2)已知均值为 30,标准差为 12.94,则可将 35 规范化为: (3) 使用小数定标规范化可将 35 规范化为:
解析
步骤 1:min-max 规范化
min-max 规范化是一种线性变换方法,将原始数据值转换到一个新的固定范围,通常为[0,1]。公式为:\[x' = \frac{x - \min(x)}{\max(x) - \min(x)}\],其中,\(x'\) 是转换后的值,\(x\) 是原始值,\(\min(x)\) 和 \(\max(x)\) 分别是数据集中的最小值和最大值。
步骤 2:z-score 规范化
z-score 规范化是一种将数据转换为标准正态分布的方法,公式为:\[x' = \frac{x - \mu}{\sigma}\],其中,\(x'\) 是转换后的值,\(x\) 是原始值,\(\mu\) 是数据集的均值,\(\sigma\) 是数据集的标准差。
步骤 3:小数定标规范化
小数定标规范化是一种通过移动小数点来规范化数据的方法,公式为:\[x' = \frac{x}{10^j}\],其中,\(x'\) 是转换后的值,\(x\) 是原始值,\(j\) 是使得最大绝对值小于1的最小整数。
min-max 规范化是一种线性变换方法,将原始数据值转换到一个新的固定范围,通常为[0,1]。公式为:\[x' = \frac{x - \min(x)}{\max(x) - \min(x)}\],其中,\(x'\) 是转换后的值,\(x\) 是原始值,\(\min(x)\) 和 \(\max(x)\) 分别是数据集中的最小值和最大值。
步骤 2:z-score 规范化
z-score 规范化是一种将数据转换为标准正态分布的方法,公式为:\[x' = \frac{x - \mu}{\sigma}\],其中,\(x'\) 是转换后的值,\(x\) 是原始值,\(\mu\) 是数据集的均值,\(\sigma\) 是数据集的标准差。
步骤 3:小数定标规范化
小数定标规范化是一种通过移动小数点来规范化数据的方法,公式为:\[x' = \frac{x}{10^j}\],其中,\(x'\) 是转换后的值,\(x\) 是原始值,\(j\) 是使得最大绝对值小于1的最小整数。