【发布时间】:2017-06-13 16:48:56
【问题描述】:
我目前正在基于单行弹性查询的Spark Job 过滤中获取elasticsearch RDD(示例):
val elasticRdds = sparkContext.esJsonRDD(esIndex, s"?default_operator=AND&q=director.name:DAVID + \n movie.name:SEVEN")
现在,如果我们的搜索查询变得复杂,例如:
{
"query": {
"filtered": {
"query": {
"query_string": {
"default_operator": "AND",
"query": "director.name:DAVID + \n movie.name:SEVEN"
}
},
"filter": {
"nested": {
"path": "movieStatus.boxoffice.status",
"query": {
"bool": {
"must": [
{
"match": {
"movieStatus.boxoffice.status.rating": "A"
}
},
{
"match": {
"movieStatus.boxoffice.status.oscar": "false"
}
}
]
}
}
}
}
}
}
}
我仍然可以将该查询转换为内联弹性查询以将其与 esJsonRDD 一起使用吗?或者无论如何,上述查询仍然可以按原样与esJsonRDD一起使用? 如果没有,在 Spark 中获取此类 RDD 的更好方法是什么?
因为 esJsonRDD 似乎只接受内联(一行)弹性查询。
【问题讨论】:
标签: scala apache-spark elasticsearch spark-dataframe rdd