【发布时间】:2016-07-11 11:59:37
【问题描述】:
这里是我要抓取的网站http://www.quickbid.com.tw/
我希望我可以将 class="timestamp" 放入 python 中的变量中,以便我可以按照我喜欢的方式解析“timestamp”。
我试过用scrapy来抓取“时间戳”,但是因为scrapy不支持javascript生成的数据,所以我无法获取。
我还尝试使用 firebug 来监控“quickbid”和我的浏览器之间传输的数据包。我发现每秒都有数据包被传输以同步时间戳。但是我仍然不知道这些数据包是如何生成的。 我听说也许 Selenium 可以帮助我实现目标。但是看了 Selenium 的教程(http://www.jroller.com/selenium/),我还是不知道如何抓取我想要的数据。
有人知道如何从这个网站上抓取数据吗?任何帮助将不胜感激。
【问题讨论】:
-
你也可以使用 PyQt/PySide 来完成这个任务,查看示例代码:github.com/integricho/path-of-a-pyqter/blob/master/qttut01/…
标签: javascript python selenium web-scraping firebug