【发布时间】:2014-01-26 23:17:19
【问题描述】:
我需要运行一个脚本,每天抓取以下网站(当脚本运行时,它会抓取当天的日历)(相当于点击“每日”按钮)
http://www.fxempire.com/economic-calendar/
我想提取特定日期的所有日期数据/事件,并过滤相关货币(如果适用),然后在每个事件发生前 10 分钟创建某种警报或弹出.
到目前为止,我正在使用以下代码来抓取网页,然后查看/打印变量“html”,但找不到我需要的日历信息。
import sys
from PyQt4.QtGui import *
from PyQt4.QtCore import *
from PyQt4.QtWebKit import *
class Render(QWebPage):
def __init__(self, url):
self.app = QApplication(sys.argv)
QWebPage.__init__(self)
self.loadFinished.connect(self._loadFinished)
self.mainFrame().load(QUrl(url))
self.app.exec_()
def _loadFinished(self, result):
self.frame = self.mainFrame()
self.app.quit()
url = 'http://www.fxempire.com/economic-calendar/'
r = Render(url)
html = r.frame.toHtml()
【问题讨论】:
-
你能告诉我们你到目前为止有什么吗?
-
抱歉,现在已更新原始帖子以包含我尝试使用的代码
标签: python python-2.7 web-scraping