【发布时间】:2021-06-02 22:35:01
【问题描述】:
我正在使用 Python Google Colab 并尝试从此链接读取 csv 文件:https://www.macrotrends.net/stocks/charts/AAPL/apple/stock-price-history
如果您向下滚动一点,您将能够看到下载按钮。我想通过使用 selenium 或 bs 获取链接并读取 csv 文件。我正在尝试做这样的事情,
# install packages
!pip install selenium
!apt-get update # to update ubuntu to correctly run apt install
!apt install chromium-chromedriver
!cp /usr/lib/chromium-browser/chromedriver /usr/bin
# load packages
import pandas as pd
from selenium import webdriver
import sys
# run selenium and read the csv file
sys.path.insert(0,'/usr/lib/chromium-browser/chromedriver')
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-dev-shm-usage')
driver = webdriver.Chrome('chromedriver',chrome_options=chrome_options)
driver.get('https://www.macrotrends.net/stocks/charts/AAPL/apple/stock-price-history')#put here the adress of your page
btn = driver.find_element_by_tag_name('button')
btn.click()
df = pd.read_csv('##.csv')
它似乎一直有效,直到btn.click() 部分,但之后出现错误,因为它没有告诉我下载按钮的链接或文件名。你能帮忙吗?那将不胜感激。
【问题讨论】:
-
您遇到了什么错误?请添加堆栈回溯。
-
@PatrickKlein btn.click() 没有做任何事情。我刚刚检查了 chitown88 方法是否完美。
标签: python selenium csv selenium-webdriver web-scraping