【发布时间】:2012-10-13 17:46:55
【问题描述】:
我使用 R 编程的时间不长,但遇到了一个项目组织问题,我希望有人能给我一些建议。我发现我所做的很多分析都是临时性的:也就是说,我运行一些东西,考虑结果,然后再运行一些。这在概念上与像 C++ 这样的语言不同,在这种语言中,您在编码之前考虑要运行的全部内容。这是解释语言的巨大优势。但是,出现的问题是我最终保存了很多 .RData 文件,因此我不必每次都 source 我的脚本。有没有人对如何组织我的项目有任何好的想法,以便我可以在一个月后返回它并很好地了解每个文件与什么相关联?
我猜这是一个文档问题。我是否应该在每个阶段都记录我的整个项目,并积极清理不再需要但作为研究副产品的文件?这是我目前的系统,但有点麻烦。还有其他人有什么建议吗?
根据下面的评论:我要避免的关键事情之一是 .R 分析文件和随之而来的 .RData 集的扩散。
【问题讨论】:
-
不,没有遇到过。让我读!谢谢
-
2 美分:无论如何,您编写的每个函数都应该包含文档。以后你会感谢自己的。您清理过的数据也应该被序列化(saveRDS),以便将来使用。其他一切都应该是一个函数,或逐行分析。这里没有对、错或“最佳”之分——只有偏好。话虽如此,如果您要克服编写文档的麻烦-您不妨实施变更管理(git,其他)和分析打包。
-
我阅读了 saveRDS 的文档,但我不明白这与 save 有何不同。唯一的区别是在saveRDS的情况下恢复对象的时候对象的名字可以不一样吗?
-
一个与对象(RDS)一起工作,另一个与环境(保存/加载)一起工作
标签: r project-management project