【问题标题】:Is there a way to continue the work from the last shutdown point when using Jupyter Notebook使用 Jupyter Notebook 时,有没有办法从最后一个关机点继续工作
【发布时间】:2019-03-13 09:38:24
【问题描述】:

我正在学习数据科学并使用 Jupyter Notebook 来完成这项工作。 我已经做了很多数据预处理和训练工作。但是我意识到每次我关闭笔记本并想在第二天继续工作时,我都必须运行所有单元格。从第一个到我上次停下来的牢房。这浪费了我的时间,因为再次运行所有单元需要很长时间。 我相信必须有更好的方法。因为我加载数据、处理数据并拟合机器学习模型,所以每次都重新开始没有意义。但是,我没有找到答案。谁能告诉我怎么做?

我刚听说Dill,它保存变量,它保存ML模型,重新打开Jupyter时,和你关闭它时完全一样吗?

【问题讨论】:

标签: jupyter-notebook data-science data-analysis


【解决方案1】:

没有办法保存整个 Jupyter 笔记本的状态。所有变量都存储在内存中。因此,当您关闭笔记本时,一切都会丢失。

您可以做的是显式保存中间步骤:

  • 对于数据处理,一旦获得最终数据集,请使用pd.write_csv(df),这样您就不必对数据进行预处理。打开笔记本时,检查文件是否存在,如果存在,将其加载到新的数据框中。
  • 训练模型后,使用pickle 库保存它(检查原始问题中的第一条评论)。并在打开 notebook 时加载训练好的模型。

如果你这样做了,你不必在每次关闭并再次打开笔记本时重新运行所有繁重的任务。

希望对您有所帮助,干杯!

【讨论】:

  • 是的。当您能够在第一次坐时创建模型时,这将起作用。可悲的是,我的工作更多是关于探索性数据分析。是的,我可以保存我所做的每个分析的输出以供以后使用,但是,每次我必须读取 csv(输入数据)以对其运行任何新分析时(考虑到我将在会话中多次处理数据- 所以关机和 readcsv 丢失)。这本身就是一种痛苦,因为文件大约 1 GB 并且需要很长时间才能读取。
猜你喜欢
  • 1970-01-01
  • 2018-10-26
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-11-24
  • 1970-01-01
  • 2018-07-28
相关资源
最近更新 更多