本章复习抓手
数据类题目经常考“处理前的问题”和“治理后的目标”。缺失、异常、不一致、重复、格式不符,是预处理常见切入点;分级分类、安全保护和质量控制,则更偏管理和治理。
核心考点
1数据采集与预处理
2数据质量问题
3数据分级分类
4数据治理和数据应用
容易丢分的地方
- 把数据清洗、数据治理、数据分析混成一个概念
- 只关注数据量,不关注数据质量
- 忽略数据安全和分级分类要求
老师式理解
数据工程章围绕数据采集、治理、质量、分级和应用展开,适合用“数据从哪里来、怎么变可信、如何产生价值”这条线理解。复习时,建议先判断题干给出的业务场景,再回到本章关键词找对应关系。软考中级并不只考“能不能背出概念”,更常考“能不能把概念放到项目建设、管理决策或系统运行的场景里”。