【发布时间】:2019-12-04 06:35:49
【问题描述】:
我在 s3 中有如下所示的日志,名称中带有时间戳。我想使用 s3distcp 将数据导入 EMR,这样我就可以使用 hive。
https://s3.amazonaws.com/mybucket/test/201305031003_0_ubuntu.gz
https://s3.amazonaws.com/mybucket/test/201305031004_0_ubuntu.gz
https://s3.amazonaws.com/mybucket/test/201305031005_0_ubuntu.gz
https://s3.amazonaws.com/mybucket/test/201305031006_0_ubuntu.gz
如何使用 s3distcp 选择日期范围?例如。从 201303031003 到 201305031003?相差两个月
【问题讨论】:
标签: amazon-s3 hive amazon-emr emr