【问题标题】:Selenium Not Scraping硒不刮
【发布时间】:2020-09-14 06:33:41
【问题描述】:

我正在尝试想办法从this site 中抓取数据,但代码不会抓取任何值。

import csv
import os
os.getcwd()
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time


options = Options()
options.headless = False
options.add_argument("--window-size=1920,1200")
driver = webdriver.Chrome(options=options, executable_path=r'insert path here')

completeurl = 'https://www.nasdaq.com/market-activity/stocks/MSFT/institutional-holdings'


driver.get(completeurl)
time.sleep(10)
increased_positions = driver.find_element_by_xpath('/html/body/div[2]/div/main/div[2]/div[4]/div[3]/div/div[1]/div/div[1]/div[2]/div/div[2]/div/table/tbody/tr[1]/td[3]')
print(increased_positions.text)

driver.quit()

此代码引发错误。

请帮忙,谢谢!

【问题讨论】:

    标签: python-3.x selenium-webdriver web-scraping selenium-chromedriver


    【解决方案1】:

    这是完成任务的一种更简单的方法,您可以从数据框列表中获取所有必需的表:-

    from selenium import webdriver
    import pandas as pd
    
    driver = webdriver.Chrome(options=options, executable_path=r'insert path here')
    
    driver.get("https://www.nasdaq.com/market-activity/stocks/msft/institutional-holdings")
    html = driver.page_source
    tables = pd.read_html(html)
    data = tables[1]
    data
    driver.quit()
    

    【讨论】:

      猜你喜欢
      • 2020-08-23
      • 2017-06-18
      • 2011-03-24
      • 1970-01-01
      • 2019-08-31
      • 2016-01-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多