Flink自带Exactly Once语义,对于支持事务的存储,可以做到数据的不重不丢。

当使用Flink来写hdfs的时候,因为hdfs文件只能在末尾进行append,如果要做到数据不重不丢,hdfs在2.7.0及其以上的版本中提供了truncate功能,可以根据valid-length长度对hdfs文件中的无效数据进行截断操作,从而保证数据不重复。

参考:Flink exactly-once 实战笔记

关于hdfs的truncate功能可以参考:HDFS Truncate文件截断

相关文章:

  • 2021-07-28
  • 2021-08-15
  • 2021-09-17
  • 2021-10-24
  • 2021-06-07
  • 2021-08-15
猜你喜欢
  • 2021-06-05
  • 2021-10-16
  • 2021-11-18
  • 2021-06-16
  • 2021-10-24
  • 2021-06-26
相关资源
相似解决方案