【发布时间】:2016-06-23 04:22:39
【问题描述】:
我有一个表架构
appname text,
randomnum int,
addedtime timestamp,
shortuuid text,
assetname text,
brandname text,
PRIMARY KEY ((appname, randomnum), addedtime, shortuuid)
addedtime 是聚类键
现在当我在集群键添加时间上使用下推过滤器时,我没有看到它被应用
val rdd = tabledf.filter("addedtime > '" + _to + "'").explain
== Physical Plan ==
Filter (cast(addedtime#2 as string) > 2016-12-20 11:00:00)
它还在 spark cassandra 连接器 1.4 中工作,但不适用于最新的 cassandra 连接器 1.6.0-M1。请告知问题
【问题讨论】:
-
这看起来像是连接器中的错误,您应该在项目中提交 Jira。
-
当然还有一些观察。我尝试使用 spark 1.5 和 1.6,但它不工作。我尝试了旧的连接器,即 1.4 和 spark 1.6,但它不工作。所以使用 spark 1.4 的连接器,同样的连接器不适用于 spark 1.6
-
nvm 想通了,请看下面的答案
-
我在下面看不到任何答案?
-
我还没写完抱歉 :)