【发布时间】:2015-04-24 16:01:59
【问题描述】:
spark streaming fileStream 如何从一个时间间隔到另一个时间间隔识别监控目录中的新文件?
它是基于新文件名还是文件创建时间戳或任何其他方法?
newFilesOnly 参数的意义是什么?
fileStream(String directory, Class<K> kClass, Class<V> vClass, Class<F> fClass, Function<org.apache.hadoop.fs.Path,Boolean> filter, boolean newFilesOnly, org.apache.hadoop.conf.Configuration conf)
【问题讨论】:
标签: apache-spark spark-streaming