【发布时间】:2011-10-15 18:13:49
【问题描述】:
所以我正在尝试抓取雅虎游戏频道/startracker,以便在玩家获得积分时获取梦幻球队的更新,这样我就可以在 Excel 中制作图表。网站网址基本上是 http://sports.yahoo.com/nfl/gamechannel?app=st&lid=60604
我对python有点陌生。
我首先尝试使用漂亮的汤,它有效并获得了页面的代码,但不是他的游戏频道,因为它需要 javascript。
我得到了 webkit 并通过它运行它,但是游戏频道应该在哪里告诉我更新我的 Flash 播放器。有什么?它是最新的。
我该怎么办?
【问题讨论】:
-
网站在flash中,你将无法使用漂亮的汤来解析它。
-
看来selenium或许能做到,值得一看。adobe.com/devnet/flash/articles/flash_selenium.htmlseleniumhq.org
-
哇这看起来真的很复杂
-
这可能也公然违反了雅虎的使用条款,所以他们不让你轻松一点也就不足为奇了。
-
ohhhhhh... 不知道。猜想尝试 n 使用他们的 api
标签: javascript python screen-scraping