每个人的身份证信息不一致,如年龄与生日数据不符,采用什么方法去处理()。
P236,不一致数据是指具有逻辑错误或者数据类型不一致的数据,如年龄与生日数据不符。这一类数据的清洗可以使用人工修改,也可以借助工具来找到违反限制的数据,如知道数据的函数依赖关系,可以通过函数关系修改属性值。但是大部分的不一致情况都需要进行数据变换,即定义一系列的变换纠正数据,有一些商业工具可以提供数据变换的功能,例如数据迁移工具和ETL工具等。A、B属于异常数据的预处理方法,c属于缺失数据的预处理方法。
简短答案
身份证年龄与生日不一致应采用什么数据处理方法,正确答案是 D(数据变换)。P236,不一致数据是指具有逻辑错误或者数据类型不一致的数据,如年龄与生日数据不符。这一类数据的清洗可以使用人工修改,也可以借助工具来找到违反限制的数据,如知道数据的函数依赖关系,可以通过函数关系修改属性值。但是大部分的不一致情况都需要进行数据变换,即定义一系列的变换纠正数据,有一些商业工具可以提供数据变换的功能,例如数据迁移工具和ETL工具等。A、B属于异常数据的预处理方法,c属于缺失数据的预处理方法。
易混淆概念对比表
| 概念 | 本题判断 | 区别要点 | 记忆提示 |
|---|---|---|---|
| 分箱法 | 本题干扰项 | 与题干描述的核心场景不匹配。 | 看到该词不要急着选,先判断是否真正解决题干问题 |
| 回归法 | 本题干扰项 | 与题干描述的核心场景不匹配。 | 看到该词不要急着选,先判断是否真正解决题干问题 |
| 均值法 | 本题干扰项 | 与题干描述的核心场景不匹配。 | 看到该词不要急着选,先判断是否真正解决题干问题 |
| 数据变换 | 本题正确答案 | P236,不一致数据是指具有逻辑错误或者数据类型不一致的数据,如年龄与生日数据不符。这一类数据的清洗可以使用人工修改,也可以借助工具来找到违反限制的数据,如知道数据的函数依赖关系,可以通过函数关系修改属性值。但是大部分的不一致情况都需要进行数据变换,即定义一系列的变换纠正数据,有一些商业工具可以提供数据变换的功能,例如数据迁移工具和ETL工具等。A、B属于异常数据的预处理方法,c属于缺失数据的预处理方法。 | 看到题干核心场景时优先联想到它 |
本题易混淆选项怎么区分
- 分箱法:与题干描述的核心场景不匹配,不能作为本题最佳答案。
- 回归法:与题干描述的核心场景不匹配,不能作为本题最佳答案。
- 均值法:与题干描述的核心场景不匹配,不能作为本题最佳答案。
知识点详解
数据工程是系统集成项目管理工程师考试中需要结合场景理解的考点。围绕“身份证年龄与生日不一致应采用什么数据处理方法”这类题目,复习时要先看题干描述的是概念定义、适用场景、作用效果,还是与其他选项的区别。本题的题干关键词是“每个人的身份证信息不一致,如年龄与生日数据不符,采用什么方法去处理()”,它指向的核心答案是 D(数据变换)。
备考速记
备考速记:题干如果强调“数据工程”中的关键目标,就先联想到 数据工程;如果选项里出现 分箱法、回归法、均值法,不要只看名称熟悉,要判断它们是否真正对应题干场景。
数据工程在数据工程场景中的作用
数据工程在本题中的核心价值,是解决“每个人的身份证信息不一致,如年龄与生日数据不符,采用什么方法去处理()”这个场景问题。复习时不要只背选项名称,还要理解它为什么适用于该场景,以及它能解决哪类安全、流程或管理问题。
同类题怎么考
- 给出数据工程场景,判断应该选择哪个概念、工具、协议或管理过程。
- 考查数据工程的作用,要求从四个相近选项中找出最符合题干目标的一项。
- 把数据工程和分箱法、回归法、均值法放在一起考,重点看适用场景是否一致。
- 题干通常会出现一个关键动作或目标,先定位关键词,再回到选项逐一排除。
数据工程在系统集成项目管理工程师软考中的考法
软考选择题通常不会只考概念定义,还会把数据工程放到数据工程场景中,要求判断它的作用、适用范围或与相近概念的区别。遇到这类题时,先抓住题干中的业务场景,再看哪个选项最能解决该场景下的核心问题。
你可能还想了解
- 身份证年龄与生日不一致应采用什么数据处理方法?
- 数据工程是什么?
- 数据工程在系统集成项目管理工程师考试中怎么考?
- 系统集成项目管理工程师数据工程题怎么理解?
本文小结
本题核心考点是数据工程在数据工程场景中的判断和应用。遇到类似题目时,先看题干描述的目标,再判断哪个选项最符合场景;本题应选择 D(数据变换)。