【发布时间】:2022-01-11 14:39:20
【问题描述】:
我们可以使用Autoloader 来跟踪是否已从 S3 存储桶加载的文件。我关于 Autoloader 的问题:有没有办法读取 Autoloader 数据库以获取已加载的文件列表?
我可以在 AWS Glue 作业书签中轻松执行此操作,但我不知道如何在 Databricks Autoloader 中执行此操作。
【问题讨论】:
-
我能否参考您正在寻找的 AWS Glue 作业书签功能。在 Glue 作业中添加了很多代码来做书签。你可以看到下面的自动加载器代码很简单,只有两个语句
标签: databricks databricks-autoloader