运维题先看流程,不要急着选动作
运行管理员的题目经常写得很像真实现场:告警来了、磁盘满了、日志很多、补丁要上线、夜班要交接。这里真正考的不是某个命令,而是处理顺序是否规范。
老师讲这类题时会反复提醒:先确认,再记录,再分析,再处置。没有确认就重启,没有记录就交接,没有恢复演练就说备份可靠,这些都是考试里常见的坑。
| 场景 | 正确抓手 | 常见误区 |
|---|---|---|
| 日常巡检 | 看运行状态、资源、日志、备份和告警 | 只看系统能不能打开 |
| 系统告警 | 记录告警、确认影响、分析原因 | 先随手重启服务 |
| 日志管理 | 保留、轮转、审计、辅助排障 | 日志越多越好或直接删除 |
| 备份恢复 | 备份后还要恢复演练 | 把备份文件存在就当可靠 |
巡检和告警:先确认影响,再处理
日常巡检不是走形式,重点是提前发现异常趋势。CPU、内存、磁盘、服务状态、日志、备份任务、告警记录都可能成为巡检对象。
系统出现告警时,不建议第一反应就是重启。告警可能只是表象,贸然重启会丢失现场信息。更稳的做法是记录告警时间、影响范围、关键日志和当前状态,再判断处理动作。
日志题:它既是证据,也是排障线索
日志能帮助定位故障发生时间、操作来源、错误信息和系统状态变化。NTP 时间同步之所以重要,是因为多台服务器日志时间不一致时,排查链路会非常混乱。
日志轮转不是为了把日志藏起来,而是按时间或大小切分、压缩和保留,避免单个日志文件无限变大,同时保持必要的追溯能力。
备份、补丁和容量:都要提前验证
备份不是终点,恢复演练才是验证备份是否真的可用的关键。很多系统平时看似有备份,真正故障时才发现备份不可恢复、版本不对或恢复时间超出业务要求。
补丁通常安排在维护窗口,是为了降低业务影响,并保留回退和验证时间。容量管理也不能等资源耗尽才做,应该通过趋势分析提前规划扩容。
交接记录:不是行政动作,是连续处置
值班交接最重要的是把未关闭事项交代清楚。告警什么时候出现、做过哪些处理、当前状态如何、下一班要继续观察什么,都应该留在记录里。
如果只是口头说“问题不大”,下一班接手时就会重新摸索,既浪费时间,也容易漏掉风险。运行管理题里,交接记录经常和可追溯、连续跟踪、故障复盘联系在一起。
相关题目解析
下面这些题目和本专题的判断方法关联较强,适合读完概念后回到具体题干里校验理解。
- 信息系统日常巡检通常检查哪些内容?系统日常巡检 / 信息系统日常巡检
- 系统出现告警后为什么不能先随手重启服务?系统告警 / 运维值班
- 服务器磁盘空间不足告警后应该先检查什么?磁盘空间告警 / 运维巡检
- 日志轮转为什么能避免日志文件无限变大?日志轮转 / 磁盘空间
- 系统日志有什么作用?日志管理 / 故障排查
- 系统日志在故障排查中有什么作用?日志审计 / 系统日志作用
- 信息系统为什么要做数据备份?数据备份 / 信息系统
- 为什么不能只做备份而不做恢复演练?备份恢复演练
- 系统补丁为什么通常安排在维护窗口内实施?补丁管理 / 维护窗口
- 服务器时间不一致为什么会影响日志分析?NTP / 时间同步
- 为什么不能等资源耗尽后才做容量扩容?容量管理 / 趋势分析
- 运行值班为什么要做好交接记录?值班交接 / 运行记录