【发布时间】:2017-01-10 02:11:10
【问题描述】:
我有一个具有以下架构的 MySql 表:
id-int
path-varchar
info-json {"name":"pat", "address":"NY, USA"....}
我使用 JDBC 驱动程序将 pyspark 连接到 MySql。我可以使用从 mysql 检索数据
df = sqlContext.sql("select * from dbTable")
这个查询一切正常。我的问题是,如何查询“信息”列?例如,下面的查询在 MySQL shell 中工作正常并检索数据,但 Pyspark (2+) 不支持。
select id, info->"$.name" from dbTable where info->"$.name"='pat'
【问题讨论】:
标签: python mysql json apache-spark pyspark