【问题标题】:Improve Loading speed of Excel into R dataframe提高 Excel 加载到 R 数据框的速度
【发布时间】:2016-05-03 11:41:20
【问题描述】:

我正在使用 xlsx 包在 R 中加载一个 excel 电子表格。它有 50 + 列和 2000 + 行。加载时间约为 12 分钟。有没有办法提高加载速度?

我正在使用的代码:

library(xlsx)
starttime = Sys.time()
res = read.xlsx("ExcelSheet.xlsx",sheetName = "Sheet1")
endtime = Sys.time()  - starttime

print (endtime)

【问题讨论】:

  • 好的。 readxl 如何提高加载速度?它处理excel数据的方式不同吗?想了解其中的区别。
  • 将 Excel 文件另存为 .csv 可能更容易。
  • readxl 应该可以完成工作,但您也可以尝试xlsx::read.xlsx2read.xlsx2read.xlsx 快得多。

标签: r excel time dataframe load


【解决方案1】:

感谢@eipi、@jenesaisquoi、@alistaire。 我可以使用 read.xlsx2 更快地加载数据。

【讨论】:

    【解决方案2】:

    尝试将 Excel 文件转换为 .csv 文件。 .csvs 阅读速度更快,所有内容都应该在一分钟内加载完毕。

    【讨论】:

    • 我正在处理的数据已格式化(即数字列、货币等)。如果我把它放在 csv 上,它会加载得更快,但是当我执行 str(dataframe) 时,它处理的数据都是错误的。有没有办法克服这些格式?
    猜你喜欢
    • 1970-01-01
    • 2014-09-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-01-06
    • 1970-01-01
    • 2014-12-03
    • 1970-01-01
    相关资源
    最近更新 更多