【发布时间】:2019-07-24 15:38:47
【问题描述】:
我正在尝试将这些句子相互比较。例如,我想看看BEFORE 是否与BEFORE THE 相同,这显然不是。但是,问题是我试图循环换行,所以
BEFORE THE PARLIAMENT ON BRITAIN'S RELATIONS 只会出现在一个字符串中。下面是一个示例文件。
BEFORE
BEFORE THE
BEFORE THE PARLIAMENT
BEFORE THE PARLIAMENT ON
BEFORE THE PARLIAMENT ON
BRITAIN'S
BEFORE THE PARLIAMENT ON
BRITAIN'S RELATIONS
BEFORE THE PARLIAMENT ON
BRITAIN'S RELATIONS WITH
我现在的做法是遍历每一行。因此,当句子超过一行时,它会拆分所有内容。
with open("test.txt") as f:
data = f.readlines()
data = [d.strip().split('\n') for d in data]
我怎样才能遍历这个文件,并一个接一个地获取每个句子,而不是遍历每一行?
【问题讨论】:
-
有点困惑。你有一个包含这些行的文件,对吗?您可以通过跟踪空行来描述句子。当有空行时,就是上一句的结尾。
-
您可以使用文档Itertools Recipes 中显示的
pairwise()函数。
标签: python python-3.x python-2.7 list newline