Python(Pandas) - 我应该在这里使用哪种正则表达式语法？答案

【问题标题】：Python(Pandas) - Which Regex Syntax should i use here?Python(Pandas) - 我应该在这里使用哪种正则表达式语法？
【发布时间】：2021-12-06 01:05:54
【问题描述】：

这里我在 Pnadas 中使用 regex（正则表达式）。

   NIFTY30DEC219000CE.NFO
    NIFTY30DEC2116000CE.NFO
    NIFTY30DEC2116000CE
    NIFTY30DEC2116111PE
    NIFTY30DEC218100PE

我有这种类型的字符串，其中'9000'是4位字符或16000 或 5 位字符，与 more 相同。并且输出应该是-

我在输出中不需要这个30DEC21。

Syntax image - which I'm using. 我正在使用这种语法。但我得到了错误的输出。

这是我的代码 - image of My Code

【问题讨论】：

【解决方案1】：

我会将str.extract 与以下正则表达式模式一起使用：

\d{2}[A-Z]{3}\d{2}(\d+)

Python 脚本：

df["output"] = df["col"].str.extract(r'\d{2}[A-Z]{3}\d{2}(\d+)')

这是一个demo，表明提取逻辑正在运行。

【讨论】：

【解决方案2】：

r"NIFTY30DEC21(\d{4,5})(CE\.NFO|CE|PE)"

【讨论】：