【发布时间】:2021-10-17 15:45:28
【问题描述】:
我在 Spark EMR 集群上使用 Jupyter Notebook,想了解有关某个命令的更多信息,但我不知道要搜索的正确技术堆栈是什么。是火花吗? Python? Jupyter 特殊语法? Pyspark?
当我尝试用谷歌搜索时,我只得到了几个结果,而且没有一个实际上包含我引用的内容。就好像它忽略了 %%。
“%%spark_sql”的作用是什么,它的来源是什么,你可以像 -s 和 -n 这样传递给它的参数是什么?
一个例子可能看起来像
%%spark_sql -s true
select
*
from df
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql jupyter-notebook amazon-emr