【问题标题】:from spark dataframe to pandas dataframe从火花数据框到熊猫数据框
【发布时间】:2019-10-01 15:29:26
【问题描述】:

我有一个通过这种方式创建的 spark 数据框:

tx_df = (spark
         .read
         .parquet("/data/file"))



tx_ecommerce = tx_df.filter(tx_df["POS_Cardholder_Presence"]=="ECommerce").show()

我尝试将 tx_commerce 转换为 pandas 数据框。我试过这样:

tx_ecommerce.toPandas()

但我得到了这个错误:

----------------------------------- ---------------------------- AttributeError Traceback(最近调用 最后)在 ----> 1 tx_ecommerce.toPandas()

AttributeError: 'NoneType' 对象没有属性 'toPandas'

请帮忙解决这个问题?

谢谢

【问题讨论】:

    标签: python pandas pyspark


    【解决方案1】:

    当你把 .show() 放在最后时,它不再是 pyspark 数据框了。

    删除它,它应该可以工作。

    tx_ecommerce =tx_df.filter(tx_df["POS_Cardholder_Presence"]=="ECommerce")
    
    tx_ecommerce.toPandas()
    

    【讨论】:

    • 不用担心。您也可以接受它作为正确答案吗?谢谢:)
    猜你喜欢
    • 1970-01-01
    • 2018-06-06
    • 2020-06-03
    • 1970-01-01
    • 2015-11-12
    • 2014-02-01
    • 1970-01-01
    相关资源
    最近更新 更多