运维值班人员收到系统 CPU 使用率持续过高告警,但业务尚未完全中断。较合适的第一步处理方式是()。
告警处理最怕“没看清就动手”。CPU 高不一定等于服务必须重启,可能是批处理、流量高峰、异常进程或监控误报。先确认、记录、判断影响,再按预案操作,才是稳妥做法。
选项分析
正确。确认告警并记录上下文,是后续判断和升级的基础。
错误。随手重启可能掩盖故障现场,还可能扩大影响。
错误。关闭告警只是让人看不见问题,不能解决问题。
错误。删除日志会破坏排障证据,也不是 CPU 高的常规处理动作。
本题为什么容易错
这题容易错在把“重启”当万能药。老师讲运维题一般会提醒:能恢复不代表做得对,尤其是还没有判断影响范围的时候。
简短答案
系统出现告警后为什么不能先随手重启服务,正确答案是 A(先确认告警真实性,记录时间、指标、影响范围,再按预案处理)。告警处理最怕“没看清就动手”。CPU 高不一定等于服务必须重启,可能是批处理、流量高峰、异常进程或监控误报。先确认、记录、判断影响,再按预案操作,才是稳妥做法。
易混淆概念对比表
| 概念 | 本题判断 | 区别要点 | 记忆提示 |
|---|---|---|---|
| 先确认告警真实性,记录时间、指标、影响范围,再按预案处理 | 本题正确答案 | 正确。确认告警并记录上下文,是后续判断和升级的基础。 | 看到题干核心场景时优先联想到它 |
| 立即重启服务器,重启后再看是否恢复 | 本题干扰项 | 错误。随手重启可能掩盖故障现场,还可能扩大影响。 | 看到该词不要急着选,先判断是否真正解决题干问题 |
| 关闭监控告警,避免继续收到通知 | 本题干扰项 | 错误。关闭告警只是让人看不见问题,不能解决问题。 | 看到该词不要急着选,先判断是否真正解决题干问题 |
| 删除系统日志,释放磁盘空间 | 本题干扰项 | 错误。删除日志会破坏排障证据,也不是 CPU 高的常规处理动作。 | 看到该词不要急着选,先判断是否真正解决题干问题 |
本题易混淆选项怎么区分
- 立即重启服务器,重启后再看是否恢复:错误。随手重启可能掩盖故障现场,还可能扩大影响。
- 关闭监控告警,避免继续收到通知:错误。关闭告警只是让人看不见问题,不能解决问题。
- 删除系统日志,释放磁盘空间:错误。删除日志会破坏排障证据,也不是 CPU 高的常规处理动作。
知识点详解
事件处置是信息系统运行管理员考试中需要结合场景理解的考点。围绕“系统出现告警后为什么不能先随手重启服务”这类题目,复习时要先看题干描述的是概念定义、适用场景、作用效果,还是与其他选项的区别。本题的题干关键词是“运维值班人员收到系统 CPU 使用率持续过高告警,但业务尚未完全中断。较合适的第一步处理方式是()”,它指向的核心答案是 A(先确认告警真实性,记录时间、指标、影响范围,再按预案处理)。
备考速记
备考速记:题干如果强调“事件处置”中的关键目标,就先联想到 事件处置;如果选项里出现 立即重启服务器,重启后再看是否恢复、关闭监控告警,避免继续收到通知、删除系统日志,释放磁盘空间,不要只看名称熟悉,要判断它们是否真正对应题干场景。
事件处置在事件处置场景中的作用
事件处置在本题中的核心价值,是解决“运维值班人员收到系统 CPU 使用率持续过高告警,但业务尚未完全中断。较合适的第一步处理方式是()”这个场景问题。复习时不要只背选项名称,还要理解它为什么适用于该场景,以及它能解决哪类安全、流程或管理问题。
同类题怎么考
- 给出事件处置场景,判断应该选择哪个概念、工具、协议或管理过程。
- 考查事件处置的作用,要求从四个相近选项中找出最符合题干目标的一项。
- 把事件处置和立即重启服务器,重启后再看是否恢复、关闭监控告警,避免继续收到通知、删除系统日志,释放磁盘空间放在一起考,重点看适用场景是否一致。
- 题干通常会出现一个关键动作或目标,先定位关键词,再回到选项逐一排除。
事件处置在信息系统运行管理员软考中的考法
软考选择题通常不会只考概念定义,还会把事件处置放到事件处置场景中,要求判断它的作用、适用范围或与相近概念的区别。遇到这类题时,先抓住题干中的业务场景,再看哪个选项最能解决该场景下的核心问题。
解题思路
题干说业务尚未完全中断,说明还有观察和判断空间。第一步应先把告警对象、时间、指标曲线、受影响业务和当前状态记录下来,再决定是否升级、限流、扩容或重启。
考点定位
本题考查运维告警的初步处置。考试并不鼓励一上来就重启,重点是确认事实、保留证据、按流程处理。
易错提醒
- 告警处置先确认,不要凭感觉操作。
- 日志、指标、时间点是后续复盘的重要证据。
- 重启属于可能的处理手段,不是所有告警的第一步。
备考提示
- 运维类题目优先选流程完整、风险较低、可追踪的做法。
- 看到“尚未完全中断”,通常不要选最激进的操作。
你可能还想了解
- 系统出现告警后为什么不能先随手重启服务?
- 事件处置是什么?
- 事件处置在信息系统运行管理员考试中怎么考?
- 信息系统运行管理员事件处置题怎么理解?
- 系统告警后先做什么怎么考?
- CPU使用率过高怎么处理怎么考?
本文小结
本题核心考点是事件处置在事件处置场景中的判断和应用。遇到类似题目时,先看题干描述的目标,再判断哪个选项最符合场景;本题应选择 A(先确认告警真实性,记录时间、指标、影响范围,再按预案处理)。