目前,最主要的如上图所示,不外乎是采集、传输、存储、计算、工具、和对外提供服务的服务层; 有兴使用了一些,如: 采集层:Sqoop、Flume、Logstash 传输层:Kafka、RocketMQ 存储层:HDFS、Kudu、TiDB 计算层:Spark、Flink 相关文章: