【问题标题】:Datalab - how to install and keep packagesDatalab - 如何安装和保存包
【发布时间】:2017-10-11 01:00:59
【问题描述】:

我决定尝试将 Google Cloud Datalab 用于我正在处理的一个小项目,而不是 AWS 实例上 Anaconda 环境中的 Jupyter Notebook。

如何将软件包(例如 OpenCV)安装到 Datalab 虚拟机上,这样我每次重新启动虚拟机时都不必重新安装它?为什么每次重启后包都会消失,但更新的笔记本仍然存在?任何回答这些问题和阐明 Datalab VM 工作原理的帮助都会非常有帮助。

【问题讨论】:

    标签: google-cloud-platform google-cloud-datalab


    【解决方案1】:

    笔记本存储在 docker 卷挂载中,该卷挂载代表永久磁盘上的一个位置,该位置在 VM 重新启动时得到维护。

    但是,您安装的软件包存储在正在运行的容器中,因此在每次重新启动时都会丢失。

    您可以创建自定义 docker 映像并使用它。在 datalab create 命令上,请参阅 --image-name 参数。

    这是您要使用的 Dockerfile 示例:

    FROM gcr.io/cloud-datalab/datalab:latest
    RUN pip install opencv
    

    请注意,您需要使用此 docker 文件构建 docker 映像,并将该映像推送到 Google Container Registry。对此我的记忆有些模糊,但这张图片可能需要标记为公开。

    希望有帮助!

    【讨论】:

    • 谢谢,尼基尔!话虽如此,我很难看到使用 Datalab 的优势,而不是仅仅在 Compute Engine 虚拟机上安装 Conda 并在那里运行 Jupyter 笔记本。这样我就可以轻松地安装新包并让它们持久地保留在实例上。我仍然不明白为什么我要在这种情况下使用 Datalab?我阅读了文档,但这仍然不清楚。
    • @haroon7 我能想到两个好处:一个是与 git repos 的集成,允许在同事之间共享工作;另一个,比部署新虚拟机、安装 python、配置开发环境等更容易更改后端的可能性。
    猜你喜欢
    • 2018-04-12
    • 2019-02-03
    • 1970-01-01
    • 2022-08-18
    • 2018-09-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多