使用以下命令设置 2 节点 TSA 集群域:
|
对这些命令的详细描述,请参考以下手册,这些手册都可以在 IBM TSA CD 上找到:
IBM Reliable Scalable Cluster Technology for Linux, Administration Guide, SA22-7892
IBM Reliable Scalable Cluster Technology for Linux, Technical Reference, SA22-7893
IBM Reliable Scalable Cluster Technology for AIX 5L: Administration Guide, SA22-7889
IBM Reliable Scalable Cluster Technology for AIX 5L: Technical Reference, SA22-7890
下面的场景展示如何创建集群、在集群中添加节点以及检查 IBM TSA 守护进程(IBM.RecoveryRM)的状态。
为了创建这个集群,需要执行以下步骤:
1. 作为 root 在集群中的每个节点上登录。
2. 在每个节点上设置环境变量 CT_MANAGEMENT_SCOPE=2:
|
3. 在所有节点上发出 preprpnode 命令,从而使集群节点能够相互通信。
|
4. 现在,可以创建名为 “SA_Domain” 的集群,它在 Node1 和 Node2 上运行。可以从任何节点发出以下命令:
|
注意: 在使用 mkrpdomain 命令创建 RSCT 对等域(集群)时,对等域名使用的字符只限于以下的 ASCII 字符:A-Z、a-z、0-9、.(点号)和 _(下划线)。
5. 要查看 SA_Domain 的状态,发出 lsrpdomain 命令:
|
集群已经定义了,但是处于离线状态。
6.发出 startrpdomain 命令,让集群在线:
|
当再次运行 lsrpdomain 命令时,会看到集群仍然处于启动过程中,OpState 是
Pending Online
。
|
注意:
1. 可能会收到下面这样的错误消息:
“2632-044 the domain cannot be created due to the following errors that were detected while harvesting information from the target nodes:
node1: 2632-068 this node has the same internal identifier as node2 and cannot be included in the domain definition.”
如果克隆了 Linux 映像,常常会发生这个错误。集群的配置出现了错误,应该重新设置整个配置。为了解决这样的问题,可以在错误消息中指出的节点上,运行 /usr/sbin/rsct/install/bin/recfgct 命令来重新设置节点 ID。
然后从 preprpnode 命令开始继续设置。
2. 还可能会收到下面这样的错误消息:
“2632-044 The domain cannot be created due to the following errors that were detected while harvesting information from the target nodes:
node1: 2610-418 Permission is denied to access the resources or resource class specified in this command.”
为了解决这个问题,应该检查主机名解析。在所有节点上的本地 /etc/hosts 文件中,确保每个集群节点的所有条目和名称服务器条目是相同的。
1. 作为根用户发出 lsrpdomain 命令,查看集群是否在线:
|
2. 发出 lsrpnode 命令,查看哪些节点在线:
|
3. 作为根用户发出以下的 preprpnode 命令,让现有节点和新节点能够相互通信。
作为根用户登录 Node3 并输入:
|
作为根用户登录 Node2 并输入:
|
作为根用户登录 Node1 并输入:
|
确保在所有节点上执行 preprpnode 命令。强烈建议这样做。
4. 为了将 Node3 添加到集群定义中,作为根用户在 Node1 或 Node2(这两个节点应该已经在集群中在线)上发出 addrpnode 命令:
|
5. 作为根用户,从一个在线节点启动 Node3:
|
经过短暂的延迟之后,Node3 应该也在线了。