正如您在创建 EMR 集群时所指出的,所有节点(主节点、从节点、任务节点)的标签都是相同的。
您会发现使用 AWS CLI 的这个过程很复杂。我的建议是查看下面的示例,然后编写一个 Python 程序来执行此操作。
将您自己的标签添加到 EC2 实例的过程。
第 1 步:列出您的 EMR 集群:
aws emr list-clusters
这将输出 JSON:
{
"Clusters": [
{
"Id": "j-ABCDEFGHIJKLM",
"Name": "'MyCluster'",
"Status": {
"State": "WAITING",
"StateChangeReason": {
"Message": "Cluster ready after last step completed."
},
"Timeline": {
"CreationDateTime": 1536626095.303,
"ReadyDateTime": 1536626568.482
}
},
"NormalizedInstanceHours": 0
}
]
}
第 2 步:记下 JSON 中的集群 ID:
"Id": "j-ABCDEFGHIJKLM",
第 3 步:描述您的 EMR 集群:
aws emr describe-cluster --cluster-id j-ABCDEFGHIJKLM
这将输出 JSON(我已将此输出截断为 MASTER 部分):
{
"Cluster": {
"Id": "j-ABCDEFGHIJKLM",
"Name": "'Test01'",
....
"InstanceGroups": [
{
"Id": "ig-2EHOYXFABCDEF",
"Name": "Master Instance Group",
"Market": "ON_DEMAND",
"InstanceGroupType": "MASTER",
"InstanceType": "m3.xlarge",
"RequestedInstanceCount": 1,
"RunningInstanceCount": 1,
"Status": {
"State": "RUNNING",
"StateChangeReason": {
"Message": ""
},
"Timeline": {
"CreationDateTime": 1536626095.316,
"ReadyDateTime": 1536626533.886
}
},
"Configurations": [],
"EbsBlockDevices": [],
"ShrinkPolicy": {}
},
....
]
}
}
第 4 步:InstanceGroups 是一个数组。找到InstanceGroupType 为MASTER 的条目。记下Id。
"Id": "ig-2EHOYXFABCDEF",
第 5 步:列出您的集群实例:
aws emr list-instances --cluster-id j-ABCDEFGHIJKLM
这将输出 JSON(我已经截断了输出):
{
"Instances": [
....
{
"Id": "ci-31LGK4KIECHNY",
"Ec2InstanceId": "i-0524ec45912345678",
"PublicDnsName": "ec2-52-123-201-221.us-west-2.compute.amazonaws.com",
"PublicIpAddress": "52.123.201.221",
"PrivateDnsName": "ip-172-31-41-111.us-west-2.compute.internal",
"PrivateIpAddress": "172.31.41.111",
"Status": {
"State": "RUNNING",
"StateChangeReason": {},
"Timeline": {
"CreationDateTime": 1536626164.073,
"ReadyDateTime": 1536626533.886
}
},
"InstanceGroupId": "ig-2EHOYXFABCDEF",
"Market": "ON_DEMAND",
"InstanceType": "m3.xlarge",
"EbsVolumes": []
}
]
}
第 6 步:找到匹配的 InstanceGroupId ig-2EHOYXFABCDEF。这将为您提供 MASTER 的 EC2 实例 ID:"Ec2InstanceId": "i-0524ec45912345678"
第 7 步:标记您的 EC2 实例:
aws ec2 create-tags --resources i-0524ec45912345678 --tags Key=EMR,Value=MASTER
使用CLI Filters 和/或jq,上述步骤可能会更简单,但这应该足以让您知道如何查找和标记 EMR 主实例。