各个运行状况监控器都有一组策略,这些策略可在发生某些条件时触发警报。了解运行状况监控的工作原理可帮助您对问题做出响应并控制未来的警报。
运行状况监控包括以下部分:
例如,存储子系统具有节点连接运行状况监控器。
任何单个子系统中出现降级状态都会导致整体系统呈现降级状态。如果所有子系统都无警报,则整体系统状态为“OK”(正常)。
每个运行状况监控器均由以下关键元素构成:
每个警报都有一个定义,其中包括警报的严重程度及其可能的原因等详细信息。
每个运行状况策略都有一个规则表达式,即触发警报的确切条件或更改。
运行状况监控器会不断监控和验证其子系统中的资源 是否存在条件或状态更改。当条件或状态更改与运行状况策略中的规则表达式匹配时,运行状况监控器便引发警报。警报将导致子系统的运行状况和整体系统运行状况都变为降级。