【发布时间】:2021-10-14 16:49:45
【问题描述】:
我正在使用 AWS Glue 爬虫来爬取 S3 存储桶,该爬虫在 Athena 中创建表架构。 我了解 Athena 不支持具有特殊字符(如(反斜杠)等)的列名。 他们是一种可以在爬虫从 S3 存储桶爬取时排除/重命名这些列名的方法。 我有几个列名称,例如 (RelatedAWSResources:0/name),当我在 Athena 中查询时,这给了我错误。 任何帮助表示赞赏。
【问题讨论】:
-
@Marcin:这样做的理想方式是什么?删除 Glue ETL 作业中的特殊字符或使用 lamda 在 Kinesis firehose 中的数据转换中删除它?
标签: amazon-web-services amazon-ec2 aws-glue aws-glue-data-catalog