【发布时间】:2020-01-25 20:09:15
【问题描述】:
数据是熊猫系列:
我正在使用df.B=df.A.str.extract(r'')
用提取的 WHERE 词创建 B 列
df:
A
HI my lines are
so super WHERE1 my car
car go anywhere
next line like this
HI my lines are
so super WHERE2 my car
one WHERE HI like me
以上数据为测试数据,HI字之间有时有40行空格。
我需要从 HI 开始的前两行获取,这始终是第一行。
从第一行开始,得到 WHERE1 和 WHERE2 字
到目前为止我的正则表达式:
^(HI(.*\n){2}) #to select first two lines
我不知道应该在哪里添加我要查找的单词 (WHERE1|WHERE2)
预期输出:
WHERE1
WHERE2
【问题讨论】:
-
预期输出是什么?
-
两个词,WHERE1 和 WHERE2
-
那么你想在每个 HI 之后获取 WHERE1 和 WHERE2 吗?
-
是的,如果 HI 是起始行,则在每个 HI 之后
-
为什么不简单地搜索每个 WHERE1 和 WHERE2?您需要职位还是其他?