【问题标题】:Convert csv file into DynamoDB json format将 csv 文件转换为 DynamoDB json 格式
【发布时间】:2016-03-11 00:16:45
【问题描述】:

我有 700 万条记录存储在 AWS S3 存储桶上托管的 CSV 文件中,我想将它们加载到 DynamoDB 表中。我尝试过数据 AWS 管道服务,但作业总是失败,因为该服务不支持导入 CSV 格式。 所以我应该先把 CSV 数据转换成 DynamoDB 可以理解的格式。有没有办法进行这种转换?

【问题讨论】:

  • 嗨@Jaco 或任何人......你有这个问题的答案吗?
  • 自定义 Python 脚本会是一个合适的解决方案吗?我不确定是否有现成的解决方案。
  • 这只是数据翻译。一个简单的脚本应该很容易解决这个问题。

标签: amazon-web-services amazon-dynamodb amazon-data-pipeline


【解决方案1】:

AWS Datapipeline 服务支持 CSV 导入到 dynamo db。您可以从 aws 控制台为 datapipeline 创建一个管道,然后选择“从 S3 导入 DynamoDB 备份数据”。将存储在 S3 中的 CSV 导入 Dynamodb。

另见

http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/DynamoDBPipeline.html#DataPipelineExportImport.Importing

【讨论】:

  • 该模板假定您要导入的数据来自 DynamoDB 导出 - 这绝对不是 CSV 格式。
  • 只是第一行(描述 csv 列)不同。其他数据行应相同。
  • 这个答案不正确。 DynamoDB 要求备份文件采用特定于 DynamoDB 的特定 JSON 格式。您无法将 CSV 直接导入 Dynamo。您可以将 CSV 文件导入 Redshift。
猜你喜欢
  • 1970-01-01
  • 2018-08-15
  • 2015-03-26
  • 2018-03-06
  • 2019-08-15
  • 2023-02-07
  • 1970-01-01
  • 2019-07-01
  • 1970-01-01
相关资源
最近更新 更多