【发布时间】:2019-04-23 05:22:52
【问题描述】:
当我从 AWS Linux AMI 启动 pyspark 时,我正在尝试为 spark 分配内存 - 即,当我调用 pyspark 时,将精确的参数传递给 driver-memory 和 executor-memory 参数。
我知道我可以在 Instance Types 页面上查看关于这个 EMR 集群的每个实例我有多少内存?的现成答案,但我想知道我是否可以从 aws cli 本身执行此操作(“实时”),这样我就可以看到在我的引导启动过程之后我实际使用了多少。
我也知道 Linux 中的 free 命令,但这似乎只给了我通过 ssh 连接到的主节点的空闲内存。我也知道 YARN UI 和 Hadoop API,但在这种情况下,如果可能的话,我想从命令行进行检查。
【问题讨论】:
标签: amazon-web-services apache-spark pyspark hadoop-yarn aws-cli