用正则表达式和熊猫分隔字符串

【问题标题】：Separate strings with regex and Pandas用正则表达式和熊猫分隔字符串
【发布时间】：2021-03-06 05:03:27
【问题描述】：

我有以下内容，我需要在 python 中将第三部分与熊猫分开，如下所示：

我的字符串：

FA0003 -BL- FA0005-BL
FA0004-BL-FA0008-BL

我的预期：

FA0005
FA0008

假设我在名为 A 的列中有一个这样的字符串，下面用于检索 FA0003 的字符串的正则表达式如下，但我现在不知道如何检索 FA0005？

FA0003 -BL- FA0005-BL
df[A].str.extract(r'(\w+\s*)', expand=False)
FA0003

【问题讨论】：

【解决方案1】：

你可以使用

^(?:[^-]*-){2}\s*([^-]+)

在 Pandas 中，将其与您当前的代码一起使用：

df[A].str.extract(r'^(?:[^-]*-){2}\s*([^-]+)', expand=False)

详情

【讨论】：