【发布时间】:2021-08-25 20:03:58
【问题描述】:
我想将 Spark SQL(安装在机器 1 上)与不同数据存储的连接器一起使用,例如 HBase、Hive、Cassandra 和 MySQL(安装在机器 2 上以执行简单的分析,例如最小值/最大值、平均等。
我的问题:这些查询的处理是在机器 1 上完成的,还是 Spark SQL 只是在数据存储端(即机器 2)上执行不同分析的接口?
【问题讨论】:
标签: apache-spark apache-spark-sql
我想将 Spark SQL(安装在机器 1 上)与不同数据存储的连接器一起使用,例如 HBase、Hive、Cassandra 和 MySQL(安装在机器 2 上以执行简单的分析,例如最小值/最大值、平均等。
我的问题:这些查询的处理是在机器 1 上完成的,还是 Spark SQL 只是在数据存储端(即机器 2)上执行不同分析的接口?
【问题讨论】:
标签: apache-spark apache-spark-sql