【发布时间】:2019-03-20 03:13:04
【问题描述】:
为什么我们总是将 .csv 文件导入 R 而不是 .xls 文件?有什么优势吗?
【问题讨论】:
-
我对这个问题感到困惑。您导入您拥有的文件。您是否询问在 CSV 与 XLS 中保存/共享数据的优缺点?
-
我一直在导入 .xls 或 .xlsx。这真的取决于你有什么。
-
xsl(旧的)是二进制数据格式,CSV只是数据。
-
更不用说 XLS/XLSX 能够(并且经常这样做)编码更多比分析通常需要的信息。 XLS 格式旨在对具有各种花里胡哨的基于表格的数据可视化显示进行编码。通常,当您想要进行分析时,您需要干净的矩形数据,这些数据在 csv/tsv 中可读编码,没有复杂的选项。
-
.csv通常是比.xlsx和.xls更可预测的文件。对于 Excel 文件,您通常有额外的标题和格式,需要在分析之前进行清理。此外,使用data.table::fread()之类的函数,我们可以快速读取非常大的数据集。
标签: r excel statistics analysis