【问题标题】:replace a string in entire dataframe from excel with value用值替换整个数据框中的字符串
【发布时间】:2021-02-22 12:00:28
【问题描述】:

我有这样的excel数据

dminerals=pd.read_excel(datafile)
print(dminerals.head(5))

然后我用这个脚本用 for 循环替换 'Tr' 和 NaN 值

for key, value in dminerals.iteritems(): 
    dminerals[key] = dminerals[key].replace(to_replace='Tr', value=int(1))
    dminerals[key] = dminerals[key].replace(to_replace=np.nan, value=int(0))

然后再次打印,它似乎工作并打印数据帧类型。但它显示对象数据类型。

print(dminerals.head(5))
print(dminerals['C'].dtypes)

我尝试使用此 .astype 将 ['C'] 列之一更改为整数,但结果是值错误

dminerals['C'].astype(int)
ValueError: invalid literal for int() with base 10: 'tr'

我以为我已经将数据框中的“Tr”更改为整数值。在上面的过程中有什么我想念的吗?请帮忙,提前谢谢!

【问题讨论】:

    标签: python pandas dataframe valueerror


    【解决方案1】:

    您将 Tr 替换为 1,但是有一个 tr 未被替换(这就是您 ValueError 所说的内容。记住 python 区分大小写。此外,使用 for 循环效率极低,您可能想尝试使用以下代码行:

    dminerales = dminerales.replace({'Tr':1,'tr':1}).fillna(0)
    

    我正在使用fillna(),在这种情况下,用指定值0 填充空值也更好,而不是使用repalce。

    【讨论】:

      猜你喜欢
      • 2021-12-14
      • 2018-06-21
      • 1970-01-01
      • 2018-01-31
      • 2015-01-29
      • 2021-09-08
      • 1970-01-01
      • 2020-02-15
      • 2021-05-13
      相关资源
      最近更新 更多