题目
建模中的数据治理包括() A. 检查异常数据:着重观察最大值、最小值、负数等明显不符合实际情况的B. 检查数据格式:检查特殊格式、空值、性别为数值等情况C. 整理缺失数据:一般情况下可接受的标准时缺失值在10%以下D. 检查逻辑错误;抽样部分数据,检查明显不符合逻辑的数据
建模中的数据治理包括()
- A. 检查异常数据:着重观察最大值、最小值、负数等明显不符合实际情况的
- B. 检查数据格式:检查特殊格式、空值、性别为数值等情况
- C. 整理缺失数据:一般情况下可接受的标准时缺失值在10%以下
- D. 检查逻辑错误;抽样部分数据,检查明显不符合逻辑的数据
题目解答
答案
ABCD
解析
数据治理是建模过程中确保数据质量的关键环节,主要包含以下核心内容:
- 异常数据检测:识别超出合理范围的数值(如负数、极端值)。
- 数据格式规范:统一数据格式,处理空值或不规范的字段(如性别用数值表示)。
- 缺失值处理:根据行业标准判断缺失值是否可接受(如10%以下通常可接受)。
- 逻辑一致性验证:通过抽样检查数据间是否符合业务逻辑。
破题关键在于理解数据治理的全流程,明确每个选项对应的具体治理措施。
选项分析
选项A
检查异常数据:通过观察最大值、最小值等指标,发现明显不符合实际的异常值(如年龄为负数)。
结论:属于数据治理核心步骤,正确。
选项B
检查数据格式:统一数据格式(如日期格式统一),处理空值或字段类型错误(如性别字段出现数值)。
结论:属于数据治理必要环节,正确。
选项C
整理缺失数据:通常认为缺失值比例低于10%时可直接使用,高于则需补充或删除。
结论:符合行业通用标准,正确。
选项D
检查逻辑错误:通过抽样检查数据间的逻辑关系(如年龄与学历不符)。
结论:属于数据治理中的逻辑验证,正确。