【问题标题】:BS4 Python get a href urlBS4 Python得到一个href url
【发布时间】:2020-12-17 19:01:17
【问题描述】:

我在 bs4 脚本上堆叠,我需要获取 href 链接或元内容,我该怎么做?基本上我需要得到这个:

<meta itemprop="image" content="https://resources.reed.co.uk/profileimages/logos/thumbs/Logo_71709.png?v=20200828172950">

<img src="https://resources.reed.co.uk/profileimages/logos/thumbs/Logo_71709.png?v=20200828172950" alt="Posted by Publica Group " width="120" height="50" class=" b-loaded" style="display: inline;">

我试过这样做:

            logoscrap = soup.find('meta', attrs={'itemprop': 'image'})

            logoscrap = soup.find('img', class_="b-loaded").attrs['src']

但我的代码不起作用...

【问题讨论】:

  • 可以分享网址吗?

标签: python beautifulsoup screen-scraping


【解决方案1】:

soup.find 返回 dict 对象,你可以直接从 dict 获取属性

img = soup.find('meta', attrs={'itemprop': 'image'})
logoscrap = img['content']
#output:
https://resources.reed.co.uk/profileimages/logos/thumbs/Logo_71709.png?v=20200828172950

img = soup.find('img', class_="b-loaded")
logoscrap  = img['src']
#output:
https://resources.reed.co.uk/profileimages/logos/thumbs/Logo_71709.png?v=20200828172950

【讨论】:

  • 酷,如果它有效,您可以将其标记为正确,以便其他人也可以利用:)
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-10-21
  • 1970-01-01
  • 1970-01-01
  • 2014-07-07
  • 2014-04-22
相关资源
最近更新 更多