【发布时间】:2020-04-13 04:04:53
【问题描述】:
我正在使用 flink 流应用程序,输入源作为 nfs 文件系统,接收器作为 kafka 生产者。
我正在使用 continousmonitoring 功能来转发不支持并行性的文件拆分和具有并行性的 continousFileOperator。
我们拥有的初始数据是 4TB 数据。对于初始传输,连续监控功能需要很长时间才能准备好状态,但检查点在完成之前一直过期。我已将 checkpointingTimeout 更改为 3 小时,仍然失败。
我能知道什么是检查点状态吗,它与数据的大小有关吗?
我可以知道如何计算州的大小吗?
对于大数据的初始运行是否有更好的方法?
【问题讨论】:
-
有多少个文件?我认为这更有可能成为瓶颈。
-
现在我正在测试环境中处理 300 万个文件。prod 中的文件不止这些。有没有一种方法可以在文件直到修改时间转发到 Continuousfileoperator 时强制快照?
标签: java filesystems state apache-flink checkpoint