【发布时间】:2015-12-18 19:57:12
【问题描述】:
我有一个 Shiny 应用程序,需要先加载一个 .RData 文件。 .RData 文件只有一个大文件,它有 2800 万行和 25 个变量。由于文件很大,Shiny 页面需要超过 2 分钟才能显示出来。我们可接受的加载时间在 30 秒内。有人对如何加快加载有任何建议吗?
我确实尝试通过 fread 函数(来自 data.table pkg)加载数据,但仍然需要 2 分钟以上才能加载。我猜 load(.RData) 还是比 fread(.csv) 快?
谢谢!
【问题讨论】:
-
你真的需要下载那么多吗?您能否在上传之前进行总结/汇总?
-
@MLavoie 不幸的是,我必须这样做,因为 Shiny 页面是为了让人们能够探索我们拥有什么样的数据。但是,文件很大,因为我将几个数据文件合并并融合在一起。也许我可以上传它们并在服务器上进行转换。
-
你不会比
fread快多少,除了readRDS(这只是一个猜测)。我真的怀疑您是否需要将所有数据存储在内存中才能“探索”它。你可以把它放在一个数据库中,然后在闪亮的应用程序中只提取它需要的部分。 -
如果你有 2800 万行,我不确定 Shiny 是否适合探索数据 :-)
-
您可以延迟加载整个数据集,方法是仅加载您需要配置流程(类别、字段名称等)的数据,这些数据可以作为单独的数据结构提供。用户界面也会加载得更快
标签: r shiny shinydashboard