【发布时间】:2019-11-23 05:10:52
【问题描述】:
我想拆分逗号、分号或连字符(前面有空格)分隔的单词。
其原因是我使用Scrapy 抓取的网站结构不一致。
到目前为止,我可以使用以下代码拆分逗号或分号分隔的单词:
for i in response.xpath('//meta[@name="keywords"]/@content').extract():
if ',' or ';' in i:
for k in i.split(',') or i.split(';'):
keywords.append([k.strip()])
else:
keywords.append([i.strip()])
如果单词是分开的,那就行了:
- 关键字1、关键字2、关键字3
- 关键字1;关键字2;关键字3
但有时关键字也存储如下:
关键字1 - 关键字2 - 关键字3
我不知道如何正确拆分它们,因为连字符之间的空格让我头疼:)。非常感谢您的帮助!
【问题讨论】:
-
the spaces in between the hyphens are...- 他们是如何给你带来问题的? - 你应该在你的问题中更明确地说明这一点。 -
起初我认为 Python 无法通过简单地添加一个空格来识别空格,例如 ' - '。所以,我想我需要指定我的代码中有一个空格。但正如我刚才在下面发布的那样,我可以简单地通过使用 elif 语句来解决它。