【发布时间】:2018-06-16 00:50:57
【问题描述】:
我正在尝试使用 Phoenix 连接器从 PySpark 读取和写入 HBase。
我在https://phoenix.apache.org/phoenix_spark.html 中看到了示例代码 在此复制示例代码以方便参考:
df.write \
.format("org.apache.phoenix.spark") \
.mode("overwrite") \
.option("table", "TABLE1") \
.option("zkUrl", "localhost:2181") \
.save()
我已经能够从 pyspark 读写到 hbase。然而,这个例子只给出了“覆盖”的模式,这意味着整个表将被覆盖。但是,我想要一个选项来从 PySpark 将数据或更新(更新插入)到 HBase。
我看到的大多数示例都是基于 scala 的,我无法获得任何关于 pyspark 支持的明确文档。
任何相同的示例代码或关于 Phoenix 连接器支持哪些其他模式的见解,我们将不胜感激。
【问题讨论】:
标签: apache-spark pyspark hbase upsert phoenix