2020-10-05【学习笔记】【企业数据湖】八、基于Apache Flink处理数据（1）

一、数据湖背景中的数据摄取层

数据摄取层是数据湖的一个核心功能层，如果需要处理来自不同应用的流式和批量数据，则该层至关重要。

1、数据摄取层

数据摄取指的是获取或导入数据用于中间处理或存储到数据库的过程。

数据摄取层的一些特性：

2、数据摄取层技术路线

2020-10-05【学习笔记】【企业数据湖】八、基于Apache Flink处理数据（1）

3、什么是apache Flink

apache Flink 是一个开源的分布式流式处理框架，能够满足各类应用的高吞吐、高可用、精确的数据处理要求。

二、为什么使用apache Flink

当然Spark也可以满足该需求，但是Flink相较于spark还是有很多优势的：