【发布时间】:2021-12-07 22:47:07
【问题描述】:
现在,databricks 自动加载器需要一个目录路径,所有文件都将从该路径加载。但万一其他类型的日志文件也开始进入该目录 - 有没有办法让 Autoloader 在准备数据帧时排除这些文件?
df = spark.readStream.format("cloudFiles") \
.option(<cloudFiles-option>, <option-value>) \
.schema(<schema>) \
.load(<input-path>)
【问题讨论】:
标签: databricks databricks-autoloader