【发布时间】:2019-12-25 09:39:32
【问题描述】:
我正在尝试从网站上抓取信息。该电子邮件在网络浏览器中可见,但在使用 Requests 和 BeautifulSoup 后,它显示[email protected]。
如何获取原文?
下面是我的代码:
for company_des in des_soup1.find_all('div',class_='flex medium-text fnt-14 align-item-center pointer'):
print(company_des.text)
截图如下:
HTML 源代码:
<div class="margin-left-5"><a href="/cdn-cgi/l/email-protection" class="__cf_email__" data-cfemail="cea6aba2a2a18ea2a7a8baa7bae0a7a0">[email protected]</a></div></div>
【问题讨论】:
-
html源码标签
<div class="margin-left-5"><a href="/cdn-cgi/l/email-protection" class="__cf_email__" data-cfemail="cea6aba2a2a18ea2a7a8baa7bae0a7a0">[email&#160;protected]</a></div></div> -
欢迎来到 Stack Overflow,请编辑您的问题并在其中包含该 html 源代码。还分享网址,以便我们进行验证。谢谢,我相信您正在处理
CloudFlare后面的webiste,它实际上是在保护HTML源不被刮掉,是电子邮件吗?hello@liftit.in
标签: html python-3.x web-scraping