【发布时间】:2018-12-28 09:00:10
【问题描述】:
我正在研究 spark-hive-hbase 集成。这里 phoenix hbase 表用于集成。
Phoenix : **apache-phoenix-4.14**
HBase : **hbase-1.4**
spark : **spark-2.3**
hive : **1.2.1**
我正在使用 spark thrift 服务器并使用 jdbc.
访问表我测试的几乎所有基本功能都运行良好。但是当我从 spark with where 条件提交查询时,它会在没有 where 条件的情况下提交给 phoenix,并且所有过滤都发生在 spark 端。
如果表有数十亿的数据,我们就不能这样做了。
示例:
Input-query: select * from hive_hbase where rowid=0;
Query-submitted: PhoenixQueryBuilder: Input query : select /*+ NO_CACHE */ "rowid","load_date","cluster_id","status" from hive_hbase
这是一个错误吗? 请建议是否有任何方法可以强制使用 where 条件(过滤器)提交查询(仅限 jdbc)。
感谢和问候 拉胡尔
【问题讨论】:
标签: apache-spark hadoop hive hbase phoenix