【发布时间】:2019-04-10 02:39:05
【问题描述】:
我正在使用 python 中的正则表达式代码来搜索文件中的每一行的正则表达式模式并提取所需的模式文件的几行看起来像这样
The Liz Copeland
2018 年 4 月 1 日星期一 号留歌() 听过评论
我想从文件中提取标题和标题 - 每个标题的行中都有 Liz Copeland,行以 5 个制表符结尾,输出应如下所示
The Liz Copeland
-每个标题都有一个制表符,后跟5个制表符分隔的列标题,输出如下
没有。留歌() 听过评论
我写了一个函数来提取正则表达式行
title = re.compile(r'([^.?!]*[.?\s!]Liz Copeland [^.?!]*[.?\s!])\t')
header = re.compile(r'\t\w+.\t.+')
with open(file) as f:
for line in f:
m_show = re.match(title, line)
m_header = re.match(header, line)
上面的代码并没有拉出所有匹配模式的行,它给了我不想要的结果
请帮我写代码。提前谢谢你
【问题讨论】:
-
你可以试试this