【发布时间】:2014-08-01 16:22:31
【问题描述】:
我正在从网站中提取一些数据,我可以成功浏览到列出前一天所有更新数据的页面,但现在我需要遍历所有链接,并将每个页面的源保存到一个文件。
一旦在一个文件中,我想使用 BeautifulSoup 来更好地排列数据,以便我可以解析它。
#learn.py
from BeautifulSoup import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
url1 = 'https://odyssey.tarrantcounty.com/default.aspx'
date = '07/31/2014'
option_by_date = "6"
driver = webdriver.Firefox()
driver.get(url1)
continue_link = driver.find_element_by_partial_link_text('Case')
#follow link
continue_link.click()
driver.find_element_by_xpath("//select[@name='SearchBy']/option[text()='Date Filed']").click()
#fill in dates in form
from_date = driver.find_element_by_id("DateFiledOnAfter")
from_date.send_keys(date)
to_date = driver.find_element_by_id("DateFiledOnBefore")
to_date.send_keys(date)
submit_button = driver.find_element_by_id('SearchSubmit')
submit_button.click()
link_list = driver.find_elements_by_partial_link_text('2014')
link_list 应该是适用链接的列表,但我不确定从那里去哪里。
【问题讨论】:
标签: python selenium selenium-webdriver web-scraping