【发布时间】:2021-11-17 06:50:32
【问题描述】:
我有一个问题。 有没有办法检查特定列中是否有拼写错误? 我有一张使用 pandas 读取的 Excel 表格。
首先我需要在 Python 中根据列名创建一个唯一列表; 其次,我需要用新值替换错误的值。
【问题讨论】:
-
错别字是什么意思?就像拼写错误的单词一样?
-
数据在'Region'列中有多个值 Midwest Northwest West Northeast East Coast Central South International Centrall Typo => 需要更改 South Typo => 需要更改
-
没有真正简单的方法可以做到这一点。我想您可以尝试制作某种模式匹配算法来识别不符合您的正常标准的术语,但这并不容易。你可以看看this,看看它是否适合你的使用
-
有没有办法使用 group_by 并找到并替换文件中的值?
-
您当然可以找到具有不在列表中的值的行,但是计算机很难确定该值的预期值。更容易将它们呈现给用户进行手动更正。
标签: python pandas replace unique