【发布时间】:2020-07-08 15:26:08
【问题描述】:
我是 Hive 新手,我需要在 Pyspark 程序中通过 HiveContext 创建一个新的 Hive 表。
如何做到这一点?请帮我解决这个问题。非常感谢!
【问题讨论】:
标签: pyspark hive apache-spark-sql
我是 Hive 新手,我需要在 Pyspark 程序中通过 HiveContext 创建一个新的 Hive 表。
如何做到这一点?请帮我解决这个问题。非常感谢!
【问题讨论】:
标签: pyspark hive apache-spark-sql
import pyspark
from pyspark.sql import HiveContext
sqlCtx= HiveContext(sc)
test_df = spark.createDataFrame([(1, 'metric1', 10), (2, 'metric2', 20), (3, 'metric3', 30)], ['id', 'metric', 'score'])
test_df.registerTempTable("df_table")
sqlCtx.sql("CREATE TABLE df_hive_table AS SELECT * from df_table")
【讨论】: