从现有配置中还原集群配置

要在集群发生故障后从现有配置中还原集群配置,请使用您选择的可供恢复节点使用的集群配置重新创建集群,然后将每个附加节点重新加入新集群中。

关于此任务

应当仅在因灾难而导致集群配置丢失时才执行此任务。

注意:如果您要从配置备份文件重新创建集群,则必须与技术支持联系,以解决配置备份文件与集群中存在的配置之间的任何差异。

步骤

  1. 为每个 HA 对禁用存储故障转移:storage failover modify -node node_name -enabled false
    对于每个 HA 对,您只需要禁用一次存储故障转移。 对某个节点禁用存储故障转移后,此节点的配对节点也将禁用存储故障转移。
  2. 暂停除恢复节点以外的每个节点:system node halt -node node_name -reason "text"
    示例
    cluster1::*> system node halt -node node0 -reason "recovering cluster"
    
    Warning: Are you sure you want to halt the node? {y|n}: y
    
  3. 将权限级别设置为高级:set -privilege advanced
  4. 在恢复节点上,使用 system configuration recovery cluster recreate 命令重新创建集群。
    示例
    以下示例使用在恢复节点上存储的配置信息来重新创建集群:
    cluster1::*> configuration recovery cluster recreate -from node
    
    Warning: This command will destroy your existing cluster. It will
             rebuild a new single-node cluster consisting of this node
             and its current configuration. This feature should only be
             used to recover from a disaster. Do not perform any other
             recovery operations while this operation is in progress.
    Do you want to continue? {y|n}: y
    
    即会在恢复节点上创建新集群。
  5. 如果要从配置备份文件重新创建集群,请验证集群恢复是否仍在进行中:system configuration recovery cluster show
    如果要从运行状况良好的节点重新创建集群,则无需验证集群恢复状态。
    示例
    cluster1::*> system configuration recovery cluster show 
     Recovery Status: in-progress
     Is Recovery Status Persisted: false
  6. 启动需要重新加入重新创建的集群中的所有节点。
    一次只能重新启动一个节点。
  7. 对于需要加入重新创建的集群中的每个节点,请执行以下操作:
    1. 从重新创建的集群上运行状况良好的节点,重新加入目标节点:system configuration recovery cluster rejoin -node node_name
      示例
      以下示例将“node2”目标节点重新加入重新创建的集群:
      cluster1::*> system configuration recovery cluster rejoin -node node2
      
      Warning: This command will rejoin node "node2" into the local
               cluster, potentially overwriting critical cluster
               configuration files. This command should only be used
               to recover from a disaster. Do not perform any other
               recovery operations while this operation is in progress.
               This command will cause node "node2" to reboot.
      Do you want to continue? {y|n}: y
      
      目标节点即会重新启动并加入集群中。
    2. 验证目标节点是否运行状况良好并且已与集群中的其余节点形成仲裁:cluster show -eligibility true
      目标节点必须重新加入重新创建的集群,然后才能重新加入其他节点。
      示例
      cluster1::*> cluster show -eligibility true
      Node                 Health  Eligibility   Epsilon
      -------------------- ------- ------------  ------------
      node0                true    true          false
      node1                true    true          false
      2 entries were displayed.
      
  8. 如果从配置备份文件重新创建了集群,请将恢复状态设置为已完成:system configuration recovery cluster modify -recovery-status complete
  9. 返回管理员权限级别:set -privilege admin
  10. 如果集群只包含两个节点,请使用 cluster ha modify 命令来重新启用集群 HA。
  11. 使用 storage failover modify 命令对每个 HA 对重新启用存储故障转移。

完成之后

如果集群具有 SnapMirror 对等关系,您还需要重新创建这些关系。有关详细信息,请参见《集群模式 Data ONTAP 数据保护指南》