【问题标题】:SVG javascript chart scrapingSVG javascript 图表抓取
【发布时间】:2014-12-09 23:23:56
【问题描述】:

当我访问 yahoo Finance 以获取日内数据时,它们会显示交互式图表,但我只能找到鼠标上次在图表中所在行的数据,它会自动更新 html...然后如果转到图表左侧的

示例: http://finance.yahoo.com/echarts?s=JPM

所以我的问题是,我可以在什么文件中找到所有这些数据?我的意思是,每次我的鼠标移到图表上时,他们都不会发送它,所以它必须存储在某个地方...... open,close,low,high,volume,%chg的值

或者更准确地说, 我如何从这种图表中抓取数据?,我的意思是我将 url 提供给一个爬虫,然后它从这个图表中下载所有内容,包括将图表移动到

有什么想法吗?

编辑:

我听说过这个 selenium+python 有人有什么想法吗?我还是卡住了=//

【问题讨论】:

    标签: charts highcharts web-crawler screen-scraping yahoo-finance


    【解决方案1】:

    1) 此图表由 javascript 生成。尝试禁用 javascript 并刷新页面 -> 没有图表
    2) 图表是 SVG
    3) 为了能够下载 SVG,您需要一个支持 javascript 的库,例如 Phantom.js
    4)你必须获取标签svg viewBox中的内容

    也许一个好的开始是从简单的事情开始的,比如老虎:http://raphaeljs.com/tiger.html

    【讨论】:

    • 感谢它已经给了我一些搜索的东西,但我找不到这样做的方法,我将尝试搜索有关 phantomjs 和抓取 svg 的问题,感谢您的帮助 =)
    • 感谢 SO 的方法是支持/接受答案;)
    • 我试过了,但我不能投票>_
    【解决方案2】:

    在这种特殊情况下,您可以使用 Excel 电子表格格式从 NASDAQ 获取股票数据。 http://www.nasdaq.com/symbol/jpm/historical

    它们还允许您设置要访问的数据的时间段。

    【讨论】:

    • 实际上我想要日内数据,问题是我什至可以从这个链接获取,但是我必须每分钟发出一个 http 请求才能这样做,如果我能用一整天图表上的一个请求,每个股票行动需要超过 4000 个请求,而 1 个请求刮掉图表,对于每日打开/关闭,这样就可以了,对于盘中(每分钟/5 x 5 mim 没有), >_
    猜你喜欢
    • 2017-03-19
    • 2019-04-13
    • 1970-01-01
    • 1970-01-01
    • 2023-03-29
    • 2019-05-13
    • 2018-01-10
    • 2020-07-15
    • 2013-11-13
    相关资源
    最近更新 更多