【发布时间】:2015-05-14 11:58:05
【问题描述】:
我创建了一个表,其中有一个 7.5 GB 大小的文本输入文件,有 6500 万条记录,现在我想将这些数据推送到 Amazon RedShift 表中。
但在处理了 560 万条记录后,它不再移动。
可能是什么问题?由于作业已经运行了 3 个小时,因此 tFileOutputDelimited 是否有任何限制。
下面是我创建的将数据推送到 Redshift 表的作业。
tFileInputDelimited(.text)---tMap--->tFilOutputDelimited(csv)
|
|
tS3Put(copy output file to S3) ------> tRedShiftRow(createTempTable)--> tRedShiftRow(COPY to Temp)
【问题讨论】:
-
您知道作业卡住的部分吗?它是在等待创建平面文件 (csv) 还是您的平面文件已创建?如果是,那么文件是否已上传到 S3? ..看看你的工作在哪一点被卡住会很有趣..因为红移复制到临时表命令会很快并且不应该卡住..
标签: talend