【发布时间】:2021-03-17 00:36:58
【问题描述】:
我正在尝试从该网站https://www.bvca.co.uk/Member-Directory 获取公司名称(例如 01Venture)和类型(例如 GENERAL PATERNER)的列表。我正在使用下面的代码:
import requests
from bs4 import BeautifulSoup
URL = 'https://www.bvca.co.uk/Member-Directory'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
print(soup.prettify())
table = soup.find('table', attrs={'id':'searchresults'})
table_body = table.find('tbody')
rows = table_body.find_all('tr')
print(rows)
我得到了一个空列表。
【问题讨论】:
-
动态加载。使用网络选项卡查看数据的真正来源(附加 xhr)或使用 selenium
-
你可能不得不使用 selenium 来获取源代码。
标签: python web-scraping beautifulsoup html-table