【发布时间】:2021-06-16 22:27:20
【问题描述】:
我有一个大的 DataFrame 需要清理,作为示例,请查看此数据框:
import pandas as pd
cars = {'Brand': ['Honda Civic','Toyota Corolla','Ford Focus','Audi A4','Suzuki'],
'Price': ['22000.T','25000.T','27000','.TPX','.NKM1']
}
df = pd.DataFrame(cars, columns = ['Brand', 'Price'])
print (df)
我想从单词的末尾删除'.T',并且只从包含的行的开头删除'.'。
通过以下代码行,我可以删除'.T'
df['Price'].replace('.T', '', regex=True)
但它也从'.TPX' 中删除了'T'
对此的任何建议表示赞赏。
0 22000
1 25000
2 27000
3 PX
4 .NKM1
Name: Price, dtype: object
也用于在我添加此行时删除 '.'
f['Price'].replace('.', '', regex=True)
我得到了一个与我预期不同的数据框
0
1
2
3
4
Name: Price, dtype: object
【问题讨论】:
标签: python regex pandas dataframe data-cleaning