【发布时间】:2021-12-25 20:47:21
【问题描述】:
我有这个问题。正如标题所说,我需要从网站下载某些 .csv 文件,但我在这样做时遇到了麻烦。我对编程非常陌生,尤其是这个主题(网络抓取)
from bs4 import BeautifulSoup as BS
import requests
DOMAIN = 'https://datos.gob.ar'
URL = 'https://datos.gob.ar/dataset/cultura-mapa-cultural-espacios-culturales/'
FILETYPE = ".csv"
def get_soup(url):
return BS(requests.get(url).text, 'html.parser')
for link in get_soup(URL).find_all('a'):
file_link = link.get('href')
if FILETYPE in file_link:
print(file_link)
此代码显示所有可用的 .csv 文件,但我只需要下载以 "biblioteca Popular.csv" 、 "cine.csv" 和 "museos.csv" 结尾的文件
也许这是一个非常简单的任务,但我找不到
【问题讨论】:
标签: web-scraping request