【发布时间】:2021-07-29 01:23:40
【问题描述】:
我开发了 spark sql 来针对 hadoop 运行。今天我必须运行一个调用我的查询的 spark 作业。还有另一种方法可以做到这一点吗?我发现我花了太多时间来解决在 spark 中运行作业的附带问题。理想情况下,我希望能够直接针对 hadoop/hbase 编写和执行 Spark SQL 查询,并完全绕过 spark 作业。在调试或尝试替代查询时,这将允许更快的迭代。
请注意,我的查询通常长达 100 行或更多,因此从命令行工作具有挑战性。
我必须从 WIndows 工作站执行此操作
【问题讨论】:
-
反对Hadoop中的什么来源?
-
@thebluephantom Spark SQL 直接针对 hadoop/hbase 查询
标签: apache-spark hadoop