【问题标题】:Trouble Uploading Large Files to RStudio using Louis Aslett's AMI on EC2在 EC2 上使用 Louis Aslett 的 AMI 将大文件上传到 RStudio 时遇到问题
【发布时间】:2014-09-13 12:54:59
【问题描述】:
【问题讨论】:
标签:
amazon-ec2
cloud
rstudio
rstudio-server
【解决方案1】:
您没有对 Amazon 服务器的 shell 访问权限吗?不要依赖 RStudio 的上传(合理地可能有 2Gb 限制)并使用适当的 unix 开发工具:
rsync -avz myHugeFile.dat amazonusername@my.amazon.host.ip:
在您的本地 PC 命令行上(安装 cygwin 或其他 unixy 兼容系统)会将您的大文件传输到您的亚马逊服务器,如果中断将从该点恢复,也会压缩数据以进行传输。
对于像这样的 Windows gui,WinSCP 是我们在 Linux 之前糟糕的过去所做的事情。
【解决方案2】:
好吧,我自己也遇到了同样的问题,这非常令人沮丧,但最终我意识到这里发生了什么。无论您的实例大小如何,AWS 的默认主目录大小都小于 8-10GB。因为这是试图上传到家里,所以没有足够的空间。有经验的 linux 用户不会落入这个陷阱,但希望任何其他遇到此问题的 Windows 新用户都能看到这一点。如果您上传到实例上的不同驱动器,则可以解决此问题。由于 Louis Aslett Rstudio AMI 基于此 8-10GB 空间,因此您必须将工作目录设置在此之外,即主目录。从 Rstudio 服务器界面看不直观。虽然这是一个高级论坛,而且这是一个新手错误,但我希望没有人删除这个问题,因为我花了几个月的时间在这个问题上,我认为其他人也会这样做。我希望这对你有意义?
【解决方案3】:
我在使用 5GB 文件时遇到了类似的问题。对我有用的是使用 SQLite 创建一个包含我需要的 csv 文件的数据库。使用 SQLite 代码来创建数据库。然后我使用 RStudio 中的一个函数与本地数据库进行通信。这样,我就能够引入 csv 文件。如果您愿意,我可以追踪我使用的 R 代码。