【发布时间】:2020-10-28 04:07:03
【问题描述】:
我在 pandas 中有一个像这样格式化的数据框。
(df)
School ID Column 1
School 1 AD6000
School 2 3000TO4000
School 3 5000TO6000
School 4 AC2000
School 5 BB3300
School 6 9000TO9900
....
我要做的就是将第 1 列中包含单词“TO”作为分隔符的行拆分为两个新列,同时保留原始列。结果会是这样。
(df)
School ID Column 1 Column 2 Column 3
School 1 AD6000 NaN NaN
School 2 3000TO4000 3000 4000
School 3 5000TO6000 5000 6000
School 4 AC2000 NaN NaN
School 5 BB3300 NaN NaN
School 6 9000TO9900 9000 9900
....
这是我认为可行的代码,但事实证明它在第 2 列和第 3 列中留下空白,而不是将 TO 左侧和右侧的数字分成各自的列。
df[['Column 2','Column 3']] = df['Column 1'].str.extract(r'(\d+)TO(\d+)')
感谢您的帮助。
【问题讨论】: