【发布时间】:2017-02-25 02:36:50
【问题描述】:
我先说我对美汤比较陌生。我理解以下行:
soup.find_all('div', class_ = 'favorite_links')[0]
会给我第一个 div 标签的全部内容,其中 class= 收藏链接。但是我真正想要的是紧挨类名右侧的文本:
<div class="favorite-links" data-can-favorite="" data-id="10820653">
</div>
我希望得到的是 data-id 之后的数字。有没有办法做到这一点?我绝对可以使用字符串操作来做到这一点,但我想知道是否有办法专门使用 BeautifulSoup 来做到这一点
对于我糟糕的术语,请提前道歉。正如我之前所说,我对 BeautifulSoup 比较陌生。
谢谢!
【问题讨论】:
标签: python-2.7 web-scraping beautifulsoup