【问题标题】:Python - Screen Scraping Yahoo! Gamechannel for fantasy footballPython - 屏幕抓取 Yahoo!梦幻足球的游戏频道
【发布时间】:2011-10-15 18:13:49
【问题描述】:

所以我正在尝试抓取雅虎游戏频道/startracker,以便在玩家获得积分时获取梦幻球队的更新,这样我就可以在 Excel 中制作图表。网站网址基本上是 http://sports.yahoo.com/nfl/gamechannel?app=st&lid=60604

我对python有点陌生。

我首先尝试使用漂亮的汤,它有效并获得了页面的代码,但不是他的游戏频道,因为它需要 javascript。

我得到了 webkit 并通过它运行它,但是游戏频道应该在哪里告诉我更新我的 Flash 播放器。有什么?它是最新的。

我该怎么办?

【问题讨论】:

  • 网站在flash中,你将无法使用漂亮的汤来解析它。
  • 看来selenium或许能做到,值得一看。adobe.com/devnet/flash/articles/flash_selenium.htmlseleniumhq.org
  • 哇这看起来真的很复杂
  • 这可能也公然违反了雅虎的使用条款,所以他们不让你轻松一点也就不足为奇了。
  • ohhhhhh... 不知道。猜想尝试 n 使用他们的 api

标签: javascript python screen-scraping


【解决方案1】:

您可能想查看 Yahoo Fantasy Sports API:http://developer.yahoo.com/fantasysports/guide/index.html

This 是你能得到的那种数据。

这有什么用吗?或者您正在尝试获取无法通过 API 获得的信息?

PS。您需要在此处获取 API 密钥:http://developer.yahoo.com/dashboard/createKey.html

【讨论】:

  • 是的,我正在考虑使用它
  • Hmm.. when there's the choice of using an API, screen scraping would be a bit insane.
  • 现在我需要将 heir api 转换为 python.. 为什么这么难 =(
  • @Acorn 我认为这是我想要的。我不知道如何在 python atm 中做到这一点
猜你喜欢
  • 1970-01-01
  • 2011-11-27
  • 2017-08-16
  • 2014-02-17
  • 2010-11-28
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-11-21
相关资源
最近更新 更多