【发布时间】:2021-09-11 17:35:45
【问题描述】:
我需要在 pandas 数据框中创建新列。
df
Id Value
1 >45%
2 >29%
3 <30 to >69
4 >40% to <56%
5 --
df_output:
Id Value Value2
1 >45% 45%
2 >29% 29%
3 <30 to >69 69
4 >40% to <56% 56%
5 -- NaN
在我的 Dataframe 中有一个名为 Value 的列,我需要在该列的顶部创建新列“Value2”。在 Value2 列中,我只需要一个基于 value 列的带后缀的数字(如果存在于 value 列中)。如果有多个像 Id 3&4 这样的数字,我需要其中最高的一个。
我试过了:
df.Value.str.extract('(\d+)')
但它只提取数字。
【问题讨论】:
-
James,还有
<80% and >16%这样的字符串吗?
标签: python regex pandas string