【问题标题】:How do I save excel file with multiple sheets from pyspark data frame如何从 pyspark 数据框中保存带有多张工作表的 excel 文件
【发布时间】:2021-02-08 18:17:48
【问题描述】:

我是 pyspark 的新手,并且在 pyspark 3.0.1 中从事数据砖的工作。我有两个 pyspark 数据框,df1 和 df2,我需要将它们保存在 ADLS gen2 中的两张 excel 文件中。所以我写了以下脚本

writer = pd.ExcelWriter(path+"multipleSheet.xlsx", engine='xlsxwriter')
df1.toPandas().to_excel(writer, sheet_name='df1')
df2.toPandas().to_excel(writer, sheet_name='df2')
writer.save()

path 是我的 ADLS 路径。不幸的是,我在运行代码时没有发现错误,也没有在我的 ADLS 中看到 excel 文件

我做错了吗?请推荐

【问题讨论】:

    标签: excel pyspark


    【解决方案1】:

    如果您想在一个文件中保存多张工作表,您可以使用:

    import pandas as pd
    
    with pd.ExcelWriter('output.xlsx', engine='xlsxwriter') as writer:
        df1.toPandas().to_excel(writer, sheet_name='Sheet_name_1')
        df2.toPandas().to_excel(writer, sheet_name='Sheet_name_2')
    

    您也可以尝试使用默认的写入引擎openpyxl(需要安装)而不是xlsxwriter

    【讨论】:

    • 它也在做同样的事情。我没有收到错误,也没有保存在 ADLS 中。看起来像我在 ADLS 中保存文件存在一些问题。我的原始代码是在本地保存 excel,但在 ADLS 中没有
    • 请问有 ADLS gen2 的解决方案吗?
    • 提出另一个关于 ADLS gen2 的问题。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-04-28
    • 1970-01-01
    • 1970-01-01
    • 2022-08-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多