【发布时间】:2014-02-14 19:11:54
【问题描述】:
我在一个研究联盟工作,该联盟拥有一个由另一个机构管理的基于网络的数据管理系统。我可以从该系统下载基础数据作为 CSV 文件的集合。使用R 和knitr,我在这些文件之上构建了一个中等复杂的报告系统。但每隔一段时间,另一家机构就会更改数据提取的格式并炸毁我的报告(或者更糟糕的是,以一种我几周都没有注意到的微妙而邪恶的方式进行更改)。
当这些事情发生时,他们可能永远不会通知我,所以我想我应该进行更多测试。我想首先测试这些 CSV 文件是否每次都具有相同的结构(但在我们收集更多数据时允许不同数量的行)。最好的方法是什么? R 是我的首选工具,但我有兴趣了解其他免费且在 Windows 上的工具。
【问题讨论】: