用于监控系统运行状况的命令

您可以使用 system health 命令显示有关系统资源运行状况的信息、对警报做出响应以及配置将来的警报。可以使用 CLI 命令深入了解有关如何配置运行状况监控的信息。有关详细信息,请参见这些命令的手册页。

显示系统运行状况的状态

操作 命令
显示系统的运行状况,该运行状况反映了各个运行状况监控器的总体状态 system health status show
显示可进行运行状况监控的子系统的运行状况 system health subsystem show

显示集群连接的状态

操作 命令
在集群级别的视图中显示磁盘架的状态 system health system-connectivity shelf show
显示有关每个磁盘架的详细信息,包括磁盘架的 UUID 和 ID、所连接的节点以及磁盘架的路径数 system health system-connectivity shelf show-instance

显示节点连接的状态

操作 命令

在节点级别的视图中显示磁盘架状态及其他信息,如所有者节点、磁盘架名称以及磁盘架的磁盘数和路径数

system health node-connectivity shelf show

使用 -instance 参数可显示有关每个磁盘架的详细信息。

显示磁盘的状态及其他信息,如所有者节点、磁盘名称和托架编号以及磁盘的路径数

system health node-connectivity disk show

使用 -instance 参数可显示有关每个磁盘的详细信息。

显示适配器的状态及其他信息,如所有者节点、是否已使用并启用适配器以及所连接的磁盘架数

system health node-connectivity adapter show

使用 -instance 参数可显示有关每个适配器的详细信息。

管理对集群和管理网络交换机的发现

操作 命令
显示集群所监控的交换机 system health cluster-switch show
显示集群当前所监控的交换机,包括已删除的交换机(显示在命令输出中的“Reason”(原因)列)以及通过网络访问集群和管理网络交换机所需的配置信息

使用此命令需要高级权限级别。

system health cluster-switch show-all
配置对未发现的交换机的发现 system health cluster-switch create
修改有关集群所监控的交换机的信息(例如设备名称、IP 地址、SNMP 版本和社区字符串) system health cluster-switch modify
禁用对交换机的监控 system health cluster-switch modify -disable-monitoring
显示运行状况监控器对交换机进行轮询以收集信息的时间间隔 system health cluster-switch polling-interval show
修改运行状况监控器对交换机进行轮询以收集信息的时间间隔

使用此命令需要高级权限级别。

system health cluster-switch polling-interval modify
禁用对交换机的发现和监控并删除交换机配置信息 system health cluster-switch delete
永久删除数据库中存储的交换机配置信息(执行此操作将重新启用自动发现交换机功能) system health cluster-switch delete -force

对生成的警报做出响应

操作 命令
显示有关生成的警报的信息,如触发警报的资源和节点,以及警报的严重程度和可能的原因 system health alert show
显示有关生成的每个警报的信息 system health alert show -instance
指示某人正在处理警报 system health alert modify
确认警报 system health alert modify -acknowledge
禁止后续警报,使其不会影响子系统的运行状况 system health alert modify -suppress
删除未自动清除的警报 system health alert delete

显示有关上周由于警报而触发的 AutoSupport 消息的信息,例如,可以确定警报是否触发了 AutoSupport 消息

system health autosupport trigger history show

配置将来的警报

操作 命令

启用或禁用相关策略以控制特定资源状态是否会引发特定警报

system health policy definition modify

显示有关运行状况监控功能配置情况的信息

操作 命令

显示有关运行状况监控器的信息,如所在节点、名称、子系统和状态

system health config show
注:使用 -instance 参数可显示有关每个运行状况监控器的详细信息。

显示有关运行状况监控器可能生成的警报的信息

system health alert definition show
注:使用 -instance 参数可显示有关每个警报定义的详细信息。

显示有关运行状况监控器策略的信息,该策略用于确定何时引发警报

system health policy definition show
注: 使用 -instance 参数可显示有关每个策略的详细信息。使用其他参数可筛选警报列表,例如,按策略状态(已启用或未启用)、运行状况监控器、警报等进行筛选。

在次要版本间对软件版本进行降级

将集群从 Data ONTAP 8.2.1 降级到 Data ONTAP 8.2 后,Data ONTAP 会清除已删除交换机的历史记录。如果自动发现的交换机不支持运行状况监控功能,则 Data ONTAP 还会将 Model 列设置为 OTHER

操作 命令
对软件版本进行降级的命令 system health cluster-switch prepare-to-downgrade