しきい値ベースのセンサーは、さまざまなシステム コンポーネントを定期的に計測します。SPは、しきい値ベースのセンサーの読み取り値と、事前に設定された制限値(コンポーネントで許容される動作状態を定義)を比較します。SPは、センサーの読み取り値に基づいてセンサーの状態を表示し、管理者はこの情報を使用してコンポーネントを監視することができます。
しきい値ベースのセンサーには、システム温度、電圧、電流、ファン速度のセンサーなどがあります。しきい値ベースのセンサーのリストは、プラットフォームによって異なります。
しきい値ベースのセンサーには次のしきい値があり、これらはSPのsystem sensorsコマンドの出力に表示されます。
センサー読み取り値がLNCとLCRの間、またはUNCとUCRの間の場合は、コンポーネントが問題の兆候を示しており、その結果、システムに障害が発生する可能性があることを示しています。したがって、コンポーネントの保守をすぐに計画する必要があります。
センサーの読み取り値がLCR以下、またはUCR以上の場合は、コンポーネントが誤動作しており、システム障害が発生しつつあることを意味します。したがって、コンポーネントに対して緊急な対応が必要です。
次の図に、各しきい値と対応する重大度の範囲を示します。
しきい値ベースのセンサーの読み取り値は、system sensorsコマンド出力の[Current]列に表示されます。 system sensors get sensor_nameコマンドを使用すると、指定したセンサーに関するその他の情報が表示されます。読み取り値が正常および異常のしきい値を超えると、センサーは重大度が上昇していることを報告します。読み取り値が各しきい値を超えると、しきい値のレベルに応じてsystem sensorsコマンド出力に表示されるセンサーのステータスが、okからnc(異常)またはcr(重要)に変わり、SELイベント ログにイベント メッセージが記録されます。
しきい値ベースのセンサーには、4つのしきい値レベルが全部揃っていないものもあります。しきい値がない場合、system sensorsコマンド出力のしきい値欄にはnaと表示されます。この値は、そのセンサーに該当するしきい値または重大度が設定されていないことを意味し、SPはそのしきい値についてセンサーを監視しません。
次の例に、SP CLIのsystem sensorsコマンドで表示される情報を示します。
SP node1> system sensors Sensor Name | Current | Unit | Status| LCR | LNC | UNC | UCR -----------------+------------+------------+-------+-----------+-----------+-----------+----------- CPU0_Temp_Margin | -55.000 | degrees C | ok | na | na | -5.000 | 0.000 CPU1_Temp_Margin | -56.000 | degrees C | ok | na | na | -5.000 | 0.000 In_Flow_Temp | 32.000 | degrees C | ok | 0.000 | 10.000 | 42.000 | 52.000 Out_Flow_Temp | 38.000 | degrees C | ok | 0.000 | 10.000 | 59.000 | 68.000 PCI_Slot_Temp | 40.000 | degrees C | ok | 0.000 | 10.000 | 56.000 | 65.000 NVMEM_Bat_Temp | 32.000 | degrees C | ok | 0.000 | 10.000 | 55.000 | 64.000 LM56_Temp | 38.000 | degrees C | ok | na | na | 49.000 | 58.000 CPU0_Error | 0x0 | discrete | 0x0180| na | na | na | na CPU0_Therm_Trip | 0x0 | discrete | 0x0180| na | na | na | na CPU0_Hot | 0x0 | discrete | 0x0180| na | na | na | na CPU1_Error | 0x0 | discrete | 0x0180| na | na | na | na CPU1_Therm_Trip | 0x0 | discrete | 0x0180| na | na | na | na CPU1_Hot | 0x0 | discrete | 0x0180| na | na | na | na IO_Mid1_Temp | 30.000 | degrees C | ok | 0.000 | 10.000 | 55.000 | 64.000 IO_Mid2_Temp | 30.000 | degrees C | ok | 0.000 | 10.000 | 55.000 | 64.000 CPU_VTT | 1.106 | Volts | ok | 1.028 | 1.048 | 1.154 | 1.174 CPU0_VCC | 1.154 | Volts | ok | 0.834 | 0.844 | 1.348 | 1.368 CPU1_VCC | 1.086 | Volts | ok | 0.834 | 0.844 | 1.348 | 1.368 1.0V | 0.989 | Volts | ok | 0.941 | 0.951 | 1.057 | 1.067 1.05V | 1.048 | Volts | ok | 0.980 | 0.999 | 1.106 | 1.125 1.1V | 1.096 | Volts | ok | 1.028 | 1.038 | 1.154 | 1.174 1.2V | 1.203 | Volts | ok | 1.125 | 1.135 | 1.261 | 1.280 1.5V | 1.513 | Volts | ok | 1.436 | 1.455 | 1.571 | 1.591 1.8V | 1.754 | Volts | ok | 1.664 | 1.703 | 1.896 | 1.935 2.5V | 2.543 | Volts | ok | 2.309 | 2.356 | 2.621 | 2.699 3.3V | 3.323 | Volts | ok | 3.053 | 3.116 | 3.466 | 3.546 5V | 5.002 | Volts | ok | 4.368 | 4.465 | 5.490 | 5.636 STBY_1.8V | 1.794 | Volts | ok | 1.678 | 1.707 | 1.892 | 1.911 …
次の例に、しきい値ベースのセンサー5VについてSP CLIにsystem sensors get sensor_nameコマンドを入力した結果を示します。
SP node1> system sensors get 5V Locating sensor record... Sensor ID : 5V (0x13) Entity ID : 7.97 Sensor Type (Analog) : Voltage Sensor Reading : 5.002 (+/- 0) Volts Status : ok Lower Non-Recoverable : na Lower Critical : 4.246 Lower Non-Critical : 4.490 Upper Non-Critical : 5.490 Upper Critical : 5.758 Upper Non-Recoverable : na Assertion Events : Assertions Enabled : lnc- lcr- ucr+ Deassertions Enabled : lnc- lcr- ucr+