【发布时间】:2017-03-07 13:43:06
【问题描述】:
我在计算集群上运行 conda 环境,其中每个“项目”的文件总数受到限制(最多 200k 个文件)。我只创建了几个 conda 环境(用于 Python 2.7 的 anaconda;每个环境中安装了大约 200 个 python 和 R 包;环境之间的包重叠度很高)并且已经达到了该文件数限制。即使使用conda clean -a,也只会删除一小部分文件。我的 conda 环境中的一些 python 包(例如 boost)包含超过 10k 的文件,而 clean 不会减少这个。
有什么方法可以大大减少存储在 conda 环境中的文件数量?
【问题讨论】:
-
是否要求您拥有所有 anaconda 软件包?安装 anaconda 包括 100 个软件包。你真的需要所有这些吗?也许你可以安装 miniconda。或者干脆用你真正需要的那些包创建一个 conda 环境。
-
是的,我至少需要这些软件包中的大部分。实际上,我什至还没有添加很多想要包含在我的 conda 环境中的生物信息学软件。我不明白为什么 conda 需要保留这些包分发中的所有这些文件。我很惊讶其他人没有遇到与 conda 环境相关的大量文件的问题。
-
那么只安装必要的软件包的 miniconda 没有帮助吗?
-
同意使用 miniconda 并明确添加软件包。如果性能不是问题,您还可以告诉 python 解释器不要生成字节码 (*.pyc) 文件。
-
我会先删除保存下载文件缓存的 pkgs 目录