【发布时间】:2021-03-05 17:36:23
【问题描述】:
我正在尝试从一个网站抓取数据,我正在使用这段代码从“跨度”内的“类”下的所有元素收集数据。但我最终只获取一个元素而不是全部。
expand_hits = soup.findAll("a", {"class": "sold-property-listing"})
apartments = []
for hit_property in expand_hits:
#element = soup.findAll("div", {"class": "sold-property-listing__location"})
place_name = expand_hits[1].find("div", {"class": "sold-property-listing__location"}).findAll("span", {"class": "item-link"})[1].getText()
print(place_name)
apartments.append(final_str)
打印的预期结果(地点名称)
Stockholm
Malmö
Copenhagen
...
..
.
print(place_name) 得到的结果
Malmö
Malmö
Malmö
...
..
.
当我尝试从 expand_hits[1] 获取内容时,我只得到一个元素。如果我没有指定索引刮板会抛出有关使用 find()、find_all() 和 findAll() 的错误。据我了解,我认为我必须迭代地调用元素的内容。
非常感谢任何帮助。 提前致谢!
【问题讨论】:
-
请问网址是什么,您希望得到多少结果?
-
hemnet.se/salda/bostader?location_ids%5B%5D=474035 我没有预期的结果。也许以千计(猜测)
-
我认为你的意思是“刮”。报废意味着扔掉。
-
糟糕!我的错。那是一个拼写错误。谢谢指正!
标签: python beautifulsoup data-science