基于阈值的传感器会定期读取各个系统组件的数据。SP 会将基于阈值的传感器的读数与其预设的阈值限制进行比较,该限制定义了组件的可接受工作条件。SP 会根据传感器读数显示传感器状态,以帮助您监控组件的状况。
基于阈值的传感器示例包括:系统温度传感器、电压传感器、电流传感器和风扇速度传感器。基于阈值的特定传感器列表取决于平台。
基于阈值的传感器具有以下阈值(显示在 SP system sensors 命令的输出中):
如果传感器读数介于 LNC 和 LCR 之间或者介于 UNC 和 UCR 之间,则表示组件有出现问题的迹象,并且可能会发生系统故障。因此,您应当计划立即进行组件维护。
如果传感器读数低于 LCR 或高于 UCR,则表示组件发生故障并且即将发生系统故障。因此,该组件需要立即引起关注。
下图说明了由阈值指定的严重性范围:
您可以在 system sensors 命令输出的 Current 列下方找到基于阈值的传感器的读数。 system sensors get sensor_name 命令显示指定传感器的其他详细信息。当基于阈值的传感器的读数超过非临界阈值和临界阈值范围时,传感器所报告问题的严重性将增加。当读数超过某一阈值限制时,system sensors 命令输出中的相应传感器状态将从 ok 变为 nc(非临界点)或 cr(临界点),具体取决于超过的阈值,并且会在 SEL 事件日志中记录事件消息。
某些基于阈值的传感器并不都具有四个阈值级别。对于这些传感器,缺少的阈值在 system sensors 命令输出中显示 na 作为其限制,这意味着特定传感器对给定阈值没有限制或者不存在严重性问题,SP 不会监控传感器的此阈值。
以下示例显示的是由 SP CLI 中的 system sensors 命令指示的信息:
SP node1> system sensors Sensor Name | Current | Unit | Status| LCR | LNC | UNC | UCR -----------------+------------+------------+-------+-----------+-----------+-----------+----------- CPU0_Temp_Margin | -55.000 | degrees C | ok | na | na | -5.000 | 0.000 CPU1_Temp_Margin | -56.000 | degrees C | ok | na | na | -5.000 | 0.000 In_Flow_Temp | 32.000 | degrees C | ok | 0.000 | 10.000 | 42.000 | 52.000 Out_Flow_Temp | 38.000 | degrees C | ok | 0.000 | 10.000 | 59.000 | 68.000 PCI_Slot_Temp | 40.000 | degrees C | ok | 0.000 | 10.000 | 56.000 | 65.000 NVMEM_Bat_Temp | 32.000 | degrees C | ok | 0.000 | 10.000 | 55.000 | 64.000 LM56_Temp | 38.000 | degrees C | ok | na | na | 49.000 | 58.000 CPU0_Error | 0x0 | discrete | 0x0180| na | na | na | na CPU0_Therm_Trip | 0x0 | discrete | 0x0180| na | na | na | na CPU0_Hot | 0x0 | discrete | 0x0180| na | na | na | na CPU1_Error | 0x0 | discrete | 0x0180| na | na | na | na CPU1_Therm_Trip | 0x0 | discrete | 0x0180| na | na | na | na CPU1_Hot | 0x0 | discrete | 0x0180| na | na | na | na IO_Mid1_Temp | 30.000 | degrees C | ok | 0.000 | 10.000 | 55.000 | 64.000 IO_Mid2_Temp | 30.000 | degrees C | ok | 0.000 | 10.000 | 55.000 | 64.000 CPU_VTT | 1.106 | Volts | ok | 1.028 | 1.048 | 1.154 | 1.174 CPU0_VCC | 1.154 | Volts | ok | 0.834 | 0.844 | 1.348 | 1.368 CPU1_VCC | 1.086 | Volts | ok | 0.834 | 0.844 | 1.348 | 1.368 1.0V | 0.989 | Volts | ok | 0.941 | 0.951 | 1.057 | 1.067 1.05V | 1.048 | Volts | ok | 0.980 | 0.999 | 1.106 | 1.125 1.1V | 1.096 | Volts | ok | 1.028 | 1.038 | 1.154 | 1.174 1.2V | 1.203 | Volts | ok | 1.125 | 1.135 | 1.261 | 1.280 1.5V | 1.513 | Volts | ok | 1.436 | 1.455 | 1.571 | 1.591 1.8V | 1.754 | Volts | ok | 1.664 | 1.703 | 1.896 | 1.935 2.5V | 2.543 | Volts | ok | 2.309 | 2.356 | 2.621 | 2.699 3.3V | 3.323 | Volts | ok | 3.053 | 3.116 | 3.466 | 3.546 5V | 5.002 | Volts | ok | 4.368 | 4.465 | 5.490 | 5.636 STBY_1.8V | 1.794 | Volts | ok | 1.678 | 1.707 | 1.892 | 1.911 …
以下示例显示了在 SP CLI 中针对基于阈值的传感器 5V 输入 system sensors get sensor_name 后的结果:
SP node1> system sensors get 5V Locating sensor record... Sensor ID : 5V (0x13) Entity ID : 7.97 Sensor Type (Analog) : Voltage Sensor Reading : 5.002 (+/- 0) Volts Status : ok Lower Non-Recoverable : na Lower Critical : 4.246 Lower Non-Critical : 4.490 Upper Non-Critical : 5.490 Upper Critical : 5.758 Upper Non-Recoverable : na Assertion Events : Assertions Enabled : lnc- lcr- ucr+ Deassertions Enabled : lnc- lcr- ucr+