使用 Jupyter Notebook 时，有没有办法从最后一个关机点继续工作

【问题标题】：Is there a way to continue the work from the last shutdown point when using Jupyter Notebook使用 Jupyter Notebook 时，有没有办法从最后一个关机点继续工作
【发布时间】：2019-03-13 09:38:24
【问题描述】：

我正在学习数据科学并使用 Jupyter Notebook 来完成这项工作。我已经做了很多数据预处理和训练工作。但是我意识到每次我关闭笔记本并想在第二天继续工作时，我都必须运行所有单元格。从第一个到我上次停下来的牢房。这浪费了我的时间，因为再次运行所有单元需要很长时间。我相信必须有更好的方法。因为我加载数据、处理数据并拟合机器学习模型，所以每次都重新开始没有意义。但是，我没有找到答案。谁能告诉我怎么做？

我刚听说Dill，它保存变量，它保存ML模型，重新打开Jupyter时，和你关闭它时完全一样吗？

【问题讨论】：

How to pickle or store Jupyter (IPython) notebook session for later的可能重复

标签： jupyter-notebook data-science data-analysis

【解决方案1】：

没有办法保存整个 Jupyter 笔记本的状态。所有变量都存储在内存中。因此，当您关闭笔记本时，一切都会丢失。

您可以做的是显式保存中间步骤：

对于数据处理，一旦获得最终数据集，请使用pd.write_csv(df)，这样您就不必对数据进行预处理。打开笔记本时，检查文件是否存在，如果存在，将其加载到新的数据框中。
训练模型后，使用pickle 库保存它（检查原始问题中的第一条评论）。并在打开 notebook 时加载训练好的模型。

如果你这样做了，你不必在每次关闭并再次打开笔记本时重新运行所有繁重的任务。

希望对您有所帮助，干杯！

【讨论】：

是的。当您能够在第一次坐时创建模型时，这将起作用。可悲的是，我的工作更多是关于探索性数据分析。是的，我可以保存我所做的每个分析的输出以供以后使用，但是，每次我必须读取 csv（输入数据）以对其运行任何新分析时（考虑到我将在会话中多次处理数据- 所以关机和 readcsv 丢失）。这本身就是一种痛苦，因为文件大约 1 GB 并且需要很长时间才能读取。

猜你喜欢

1970-01-01
2018-10-26
1970-01-01
1970-01-01
1970-01-01
1970-01-01
2019-11-24
1970-01-01
2018-07-28

相关资源

下载 2021-06-06
下载 2021-06-07
下载 2021-06-24
下载 2022-12-20

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode