【发布时间】:2019-12-25 16:50:44
【问题描述】:
这可能是一个微不足道的问题,但我不知道如何进行:
我有一个名为 data 的数据框,它取自一个 excel 文件:
data = pd.read_excel("C:\\Users\\firstname.lastname\\Desktop\\variable+".xlsx", sheet_name=variable2, na_values='', usecols="A,B", skiprows=range(2))
这可以很好地加载文件,但是在 B 列中有一个精确等于“NA”的字符串,在生成的数据框中,它不会显示为 NA,而是显示为空白。
我假设 pandas 将此 NA 解释为空白,因此将其留空。
但这是一个合法的 NA,我希望它说 NA 不是空白。
我已经尝试替换:
na_values='NA'
并且还使用正则表达式将空白的列值替换为“NA”(这不是我承认的最佳解决方案,但在这种情况下可以工作,因为 B 列只有一个 NA 变为空白。
df.replace(r'^\s+$', np.nan, regex=True)
我做错了什么?
【问题讨论】:
-
na_filter=False 为我工作。
标签: python regex python-3.x pandas dataframe