【发布时间】:2020-06-01 23:24:48
【问题描述】:
这是我第一次尝试编程。我正在尝试通过 scraping 使用 bs4、selenium 等 scrape 一些单词... 我使用的网站是'http://oulim.kr'
我如何抓取框架集中的东西?
这是我尝试过的
import urllib
from bs4 import BeautifulSoup
from selenium import webdriver
url = 'http://oulim.kr/'
driver = webdriver.Chrome('./driver/chromedriver')
driver.get(url)
html = driver.page_source
soup = BeautifulSoup(html)
a = soup.select("#divAlba > table:nth-child(3) > tbody > tr:nth-child(2) > td:nth-child(5) > a > font > b")
print(a)
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('http://oulim.kr')
r.html.find('.tbody')
【问题讨论】:
-
你为什么不使用 BS 从帧中抓取 - 你有 url
"main.asp"和 'oulim.kr' 所以它应该使用'http://oulim.kr/main.asp'和BeautifulSoup。 -
Selenium 拥有
driver.switch_to.frame(...) -
仅供参考,它是 scrape 和 scrape 不是报废或报废
标签: python html web-scraping frame