【发布时间】:2017-10-09 21:54:49
【问题描述】:
我正在尝试抓取 zillow 网站的内容。
问题是我无法抓取价格和税收历史记录的内容。 我认为它们是页面加载时加载的 javascript 元素,因此尝试使用 selenium,但我仍然无法获取它们。 以下是我尝试过的。
代码
phistory = soup.find("div",{"id": "hdp-price-history"})
print phistory
HTML
<div class="loading yui3-widget yui3-async-block yui3-complaintstable yui3-hdppricehistory yui3-hdppricehistory-content" id="hdp-price-history">
div class="zsg-content-section zsg-loading-spinner_lg"></div>
</div>
这是最外层的元素,但里面没有任何元素。还尝试了soup.find_all("table",class_ = "zsg-table yui3-toggle-content-minimized"),它没有产生任何元素。
【问题讨论】:
-
能贴一下爬虫代码吗?
-
相关代码在上面。
标签: python html selenium beautifulsoup screen-scraping