【发布时间】:2018-05-12 11:36:52
【问题描述】:
我一直在尝试移除刮掉的绳子的不必要部分,但遇到了困难。我确信这很简单,但我可能缺乏寻找有效解决方案的术语。
我有我需要的所有信息,现在正在尝试创建一个干净的输出。我正在使用此代码...
for each in soup.findAll('div', attrs={'class': 'className'}):
print(each.text.split('\n'))
输出是数字和带有可变空格的文本的混合,类似于...
['', '', '', ' 1 ', ' Text Example', ' (4)']
我需要生成一个类似...的列表
['1', 'Text Example', '(4)']
也许甚至从数字 4 中删除括号“()”。
谢谢。
【问题讨论】:
-
我尝试使用 split() 和 strip() 变体删除空格,但我无法找出我需要的组合。
-
text.strip()不带参数删除空格、制表符、回车。如果你有列表,那么你有result = [x.strip() for x in your_list if x.strip() != ''] -
@furas 但是当我这样做时,它会不断拆分我需要的两个单词文本,例如。 ['文本','示例']。我需要他们在一起。
-
strip()仅在末尾删除 -split()将文本拆分为单词,因此不要使用它。
标签: python html string beautifulsoup