了解系统传感器命令输出中基于阈值的 SP 传感器读数和状态值

基于阈值的传感器会定期读取各个系统组件的数据。SP 会将基于阈值的传感器的读数与其预设的阈值限制进行比较,该限制定义了组件的可接受工作条件。SP 会根据传感器读数显示传感器状态,以帮助您监控组件的状况。

基于阈值的传感器示例包括:系统温度传感器、电压传感器、电流传感器和风扇速度传感器。基于阈值的特定传感器列表取决于平台。

基于阈值的传感器具有以下阈值(显示在 SP system sensors 命令的输出中):

如果传感器读数介于 LNC 和 LCR 之间或者介于 UNC 和 UCR 之间,则表示组件有出现问题的迹象,并且可能会发生系统故障。因此,您应当计划立即进行组件维护。

如果传感器读数低于 LCR 或高于 UCR,则表示组件发生故障并且即将发生系统故障。因此,该组件需要立即引起关注。

下图说明了由阈值指定的严重性范围:


This graphic is described by the surrounding text.

您可以在 system sensors 命令输出的 Current 列下方找到基于阈值的传感器的读数。 system sensors get sensor_name 命令显示指定传感器的其他详细信息。当基于阈值的传感器的读数超过非临界阈值和临界阈值范围时,传感器所报告问题的严重性将增加。当读数超过某一阈值限制时,system sensors 命令输出中的相应传感器状态将从 ok 变为 nc(非临界点)或 cr(临界点),具体取决于超过的阈值,并且会在 SEL 事件日志中记录事件消息。

某些基于阈值的传感器并不都具有四个阈值级别。对于这些传感器,缺少的阈值在 system sensors 命令输出中显示 na 作为其限制,这意味着特定传感器对给定阈值没有限制或者不存在严重性问题,SP 不会监控传感器的此阈值。

system sensors 命令输出示例

以下示例显示的是由 SP CLI 中的 system sensors 命令指示的信息:

SP node1> system sensors

Sensor Name      | Current    | Unit       | Status| LCR       | LNC       | UNC       | UCR
-----------------+------------+------------+-------+-----------+-----------+-----------+-----------
CPU0_Temp_Margin | -55.000    | degrees C  | ok    | na        | na        | -5.000    | 0.000     
CPU1_Temp_Margin | -56.000    | degrees C  | ok    | na        | na        | -5.000    | 0.000     
In_Flow_Temp     | 32.000     | degrees C  | ok    | 0.000     | 10.000    | 42.000    | 52.000    
Out_Flow_Temp    | 38.000     | degrees C  | ok    | 0.000     | 10.000    | 59.000    | 68.000    
PCI_Slot_Temp    | 40.000     | degrees C  | ok    | 0.000     | 10.000    | 56.000    | 65.000    
NVMEM_Bat_Temp   | 32.000     | degrees C  | ok    | 0.000     | 10.000    | 55.000    | 64.000    
LM56_Temp        | 38.000     | degrees C  | ok    | na        | na        | 49.000    | 58.000    
CPU0_Error       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        
CPU0_Therm_Trip  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        
CPU0_Hot         | 0x0        | discrete   | 0x0180| na        | na        | na        | na        
CPU1_Error       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        
CPU1_Therm_Trip  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        
CPU1_Hot         | 0x0        | discrete   | 0x0180| na        | na        | na        | na        
IO_Mid1_Temp     | 30.000     | degrees C  | ok    | 0.000     | 10.000    | 55.000    | 64.000    
IO_Mid2_Temp     | 30.000     | degrees C  | ok    | 0.000     | 10.000    | 55.000    | 64.000    
CPU_VTT          | 1.106      | Volts      | ok    | 1.028     | 1.048     | 1.154     | 1.174     
CPU0_VCC         | 1.154      | Volts      | ok    | 0.834     | 0.844     | 1.348     | 1.368     
CPU1_VCC         | 1.086      | Volts      | ok    | 0.834     | 0.844     | 1.348     | 1.368     
1.0V             | 0.989      | Volts      | ok    | 0.941     | 0.951     | 1.057     | 1.067    
1.05V            | 1.048      | Volts      | ok    | 0.980     | 0.999     | 1.106     | 1.125     
1.1V             | 1.096      | Volts      | ok    | 1.028     | 1.038     | 1.154     | 1.174     
1.2V             | 1.203      | Volts      | ok    | 1.125     | 1.135     | 1.261     | 1.280     
1.5V             | 1.513      | Volts      | ok    | 1.436     | 1.455     | 1.571     | 1.591     
1.8V             | 1.754      | Volts      | ok    | 1.664     | 1.703     | 1.896     | 1.935     
2.5V             | 2.543      | Volts      | ok    | 2.309     | 2.356     | 2.621     | 2.699     
3.3V             | 3.323      | Volts      | ok    | 3.053     | 3.116     | 3.466     | 3.546     
5V               | 5.002      | Volts      | ok    | 4.368     | 4.465     | 5.490     | 5.636     
STBY_1.8V        | 1.794      | Volts      | ok    | 1.678     | 1.707     | 1.892     | 1.911      
…

基于阈值的传感器的 system sensors get sensor_name 命令输出示例

以下示例显示了在 SP CLI 中针对基于阈值的传感器 5V 输入 system sensors get sensor_name 后的结果:

SP node1> system sensors get 5V    
            
Locating sensor record...
Sensor ID              : 5V (0x13)
 Entity ID             : 7.97
 Sensor Type (Analog)  : Voltage
 Sensor Reading        : 5.002 (+/- 0) Volts
 Status                : ok
 Lower Non-Recoverable : na
 Lower Critical        : 4.246
 Lower Non-Critical    : 4.490
 Upper Non-Critical    : 5.490
 Upper Critical        : 5.758
 Upper Non-Recoverable : na
 Assertion Events      : 
 Assertions Enabled    : lnc- lcr- ucr+ 
 Deassertions Enabled  : lnc- lcr- ucr+