【发布时间】:2019-06-14 17:56:15
【问题描述】:
我目前正在学习网络抓取。今天我尝试在网上搜索 google.com 搜索。当我尝试使用 python 请求库发出 get 请求时,它并没有为我提供完整的响应。
例如,如果我调用此 URL https://www.google.com/search?q=tea+meaning 来获取单词 tea 的含义,那么在结果响应中它只显示名词内容而不是动词内容。
from bs4 import BeautifulSoup as bs
import requests as req
headers_Get = {
'Host': 'www.google.com',
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/74.0.3729.169 Chrome/74.0.3729.169 Safari/537.36',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'en-US,en;q=0.5',
'Accept-Encoding': 'gzip, deflate',
'DNT': '1',
'Connection': 'keep-alive',
'Upgrade-Insecure-Requests': '1'
}
url = "https://www.google.com/search?q=tea+meaning"
response = req.get(url, headers=headers_Get)
data = response.text
soup = bs(data, "html.parser")
问题出在这汤上。它不包含动词内容。 为什么会这样?
谢谢。
【问题讨论】:
-
什么是动词内容?
-
不包含动词内容,动词内容是什么意思?
-
打印(soup.prettify())
-
这是完整的响应。
-
茶不是动词,所以...?
标签: python web-scraping beautifulsoup python-requests