【发布时间】:2017-06-05 20:24:27
【问题描述】:
我在AWS EMR上运行一个Spark step,这个step是通过Boto3添加到EMR中的,我想把任务完成的百分比返回给用户,请问有什么办法吗?
我想用 Spark 完成的阶段数来计算这个百分比,我知道这不会太精确,因为第 4 阶段可能需要比第 5 阶段花费两倍的时间,但我可以接受。
是否可以使用 boto3 访问这些信息?
我检查了list_steps 方法(here 是文档),但只有在没有其他信息的情况下运行时,我才会得到响应。
【问题讨论】:
标签: python apache-spark pyspark amazon-emr