【发布时间】:2014-07-03 02:42:34
【问题描述】:
我一直在尝试使用 mechanize 抓取国会财务披露reports;表单提交成功,但我找不到任何搜索结果。我的脚本如下:
br = Browser()
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
br.open('http://clerk.house.gov/public_disc/financial-search.aspx')
br.select_form(name='aspnetForm')
br.set_all_readonly(False)
br['filing_year'] = ['2008']
response = br.submit(name='search_btn')
html = response.read()
我是抓取新手,如果对此有任何更正/建议,我将不胜感激。谢谢!
【问题讨论】:
-
您是否可以使用
selenium的替代解决方案? -
@alecxe 当然,如果这是首选方法
标签: python-2.7 web-scraping mechanize