【发布时间】:2021-09-03 12:10:39
【问题描述】:
所以我有一个名为 usa_sub_states 的数据框,其中有一列名为 'state'。
在state 的列中,有 5 个状态为非字母字符串。
Massachusetts[C]
Pennsylvania[C]
Rhode Island[D]
Virginia[C]
Hawai'i
现在我想知道是否有一种方法可以将所有特殊字符替换为空字符串,以便它们都作为常规状态名称出现。
usa_sub_states.state.replace(to_replace=r'[\W]', value='', regex=True, inplace=True)
但由于某种原因,这删除了该列的所有内容并使其成为空字符串。
【问题讨论】:
-
试试
usa_sub_states['state'] = usa_sub_states['state'].str.replace(r"\[[^][]*]|\W", "", regex=True),见regex demo。 -
成功了! TYTYTYTY
-
我只是有一个问题。
-
你将如何用格式编写语法
-
usa_states_sub.state.replace(to_replace=___, value=__, regex=___, inplace=___)