【发布时间】:2017-07-15 23:26:06
【问题描述】:
https://plus.google.com/s/casasgrandes27%40gmail.com/top
我需要使用 python 抓取以下页面,但我需要它的 HTML 而不是链接的通用源代码。
例如
打开链接:plus.google.com/s/casasgrandes27%40gmail.com/top 没有登录倒数第二个缩略图将是“G Suite”。
<div class="Wbuh5e" jsname="r4nke">G Suite</div>
执行此 python 代码后,我无法找到上面的 HTML 代码行。
from bs4 import BeautifulSoup
import requests
L = list()
r = requests.get("https://plus.google.com/s/casasgrandes27%40gmail.com/top")
data = r.text
soup = BeautifulSoup(data,"lxml")
print(soup)
【问题讨论】:
-
我是用BeautifulSoup爬取页面的,见上面的代码
标签: python html web-crawler rendering