【问题标题】:Using pyspark to connect to hive tables使用 pyspark 连接配置单元表
【发布时间】:2016-03-18 05:48:35
【问题描述】:

我正在尝试从 pyspark 查询 Hive 表。

我正在使用以下语句:

from pyspark.sql import HiveContext    
HiveContext(sc).sql('from `dbname.tableName` select `*`')

我对 hadoop 系统非常陌生。 需要了解从 hive 表中获取一些数据并将其存储到数据框中以进一步编写程序的正确方法是什么。

【问题讨论】:

    标签: python hive pyspark


    【解决方案1】:

    sqlCtx.sql 可以访问 hive 表。您可以按照以下方式使用它。

    my_dataframe = sqlCtx.sql("Select * from employees")
    
    my_dataframe.show()
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-01-20
      • 1970-01-01
      • 2020-05-19
      • 2020-08-14
      • 2019-12-29
      • 1970-01-01
      相关资源
      最近更新 更多