【发布时间】:2021-03-09 07:50:49
【问题描述】:
我已经开始使用 google colab 来训练神经网络,但是我拥有的数据非常大(4GB 和 18GB)。我目前将所有这些数据存储在一个驱动器中,但我的谷歌驱动器上没有足够的空间来传输这些文件。
有没有办法让我直接从 google colab 中的一个驱动器访问数据?
我试过直接从我自己的机器上加载数据,但是我觉得这个过程太费时了,我的机器真的没有足够的空间来存储这些文件。我也尝试在 ? 之后添加 download=1在文件的超链接中但是这不会下载并且只显示超链接。使用 wget 时会产生“错误 403:禁止”。消息。
我希望 google colab 文件下载此压缩文件并从中解压缩数据以进行训练。
【问题讨论】:
-
我认为这种方法可以节省您的大量时间。首先,将所有数据文件放在一个 zip 文件(.rar 或 .zip)中。您可以在 GitHub 中创建一个私有 repo,然后将 arcive 上传到 repo。在这里,您可以选择查看原始文件。打开那个链接。现在,您可以在 Google Colab 中使用 Python 打开此 url。并提取所有文件。
-
谢谢,但是这种方法的问题是我的 GitHub 帐户只有 1GB 的空间,而我的一个驱动器上有 1TB 的空间。我希望将来会使用更多数据,因此我希望有一个系统可以在我拥有这些数据时使用。因此,为什么直接从一个驱动器收集数据很重要。
-
@JoshWilde 您是否成功解决了问题并获得了 Colab 对 oneDrive 的访问权限?
标签: onedrive google-colaboratory