【问题标题】:How can you update a pyfile in the middle of a PySpark shell session?如何在 PySpark shell 会话中更新 pyfile?
【发布时间】:2018-06-21 07:05:56
【问题描述】:

在交互式 pyspark 会话中,您可以通过 sc.addPyFile('file_location') 导入 python 文件。如果您需要对该文件进行更改并保存它们,是否有任何方法可以“重新广播”更新后的文件,而无需关闭您的 spark 会话并开始一个新的会话?

简单地再次添加文件是行不通的。我不确定重命名文件是否有效,但无论如何我都不想这样做。

据我从 spark 文档中可以看出,只有一种添加 pyfile 的方法,而不是更新一个。我希望我错过了什么!

谢谢

【问题讨论】:

  • 我还没有测试过这个,但是你能在你的 pyspark-shell 中关注stackoverflow.com/questions/6946376/… 吗?
  • 您是否尝试在 spark-defaults.conf 中将 spark.files.overwrite 设置为 true? spark.apache.org/docs/latest/configuration.html
  • 嗯,我没有尝试过其中任何一个。你的 sparknoob 听起来正是我正在寻找的东西,所以我会先尝试并回复你。谢谢。
  • 不,不幸的是那些对我不起作用。我尝试了 sc.addFile 和 sc.addPyFile,但它们似乎都没有在会话中用我的更改覆盖文件。还有其他可能的解决方案吗?
  • 查看stackoverflow.com/a/44387776/1843329,尽管听起来该解决方案在实践中并不可靠。

标签: python apache-spark pyspark


【解决方案1】:

我认为在交互式会话期间这是不可行的。您必须重新启动会话才能使用修改后的模块。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-04-19
    • 1970-01-01
    • 1970-01-01
    • 2021-05-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多