【问题标题】:pandas read_excel function replacing "NA" with blanks? [duplicate]pandas read_excel 函数用空格替换“NA”? [复制]
【发布时间】:2019-12-25 16:50:44
【问题描述】:

这可能是一个微不足道的问题,但我不知道如何进行:

我有一个名为 data 的数据框,它取自一个 excel 文件:

data = pd.read_excel("C:\\Users\\firstname.lastname\\Desktop\\variable+".xlsx", sheet_name=variable2, na_values='', usecols="A,B", skiprows=range(2))

这可以很好地加载文件,但是在 B 列中有一个精确等于“NA”的字符串,在生成的数据框中,它不会显示为 NA,而是显示为空白。

我假设 pandas 将此 NA 解释为空白,因此将其留空。

但这是一个合法的 NA,我希望它说 NA 不是空白。

我已经尝试替换:

na_values='NA'

并且还使用正则表达式将空白的列值替换为“NA”(这不是我承认的最佳解决方案,但在这种情况下可以工作,因为 B 列只有一个 NA 变为空白。

df.replace(r'^\s+$', np.nan, regex=True)

我做错了什么?

【问题讨论】:

  • na_filter=False 为我工作。

标签: python regex python-3.x pandas dataframe


【解决方案1】:

根据pandas文档,尝试在pd.read_excel的参数中添加keep_default_na=False

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2022-01-22
    • 1970-01-01
    • 2021-05-21
    • 2020-09-13
    • 2020-01-20
    • 2018-10-14
    • 2017-01-13
    相关资源
    最近更新 更多