【发布时间】:2021-06-18 01:05:55
【问题描述】:
我正在抓取维基百科的表格,并试图从这个网站获取一些法国城市的人口:https://fr.wikipedia.org/wiki/Liste_des_communes_du_Pas-de-Calais
目前,我不想使用dataframes,我想直接使用标签选择我的项目。但是当我要求程序打印属性“data-sort-value”的值时,它返回一个 None 列表,而在网站的 HTML 代码中,该属性是人口数字。为什么?
这是我的代码
import requests
from bs4 import BeautifulSoup as bs
res=requests.get("https://fr.wikipedia.org/wiki/Liste_des_communes_du_Pas-de-Calais")
soup=bs(res.text,"html.parser")
tableau=soup.find('table','wikitable')
lignes = tableau.findAll("tr")
liste=[]
for ligne in lignes:
nombre=ligne.find("td", "data-sort-value")
print(nombre)
liste.append(nombre)
【问题讨论】:
标签: python web-scraping beautifulsoup tags wikipedia