【发布时间】:2016-04-05 20:43:17
【问题描述】:
我正在从http://www.espncricinfo.com/wcldiv4-2012/engine/match/576414.html 获取实时更新,我能够做的是使用 wget 和正则表达式获取实时记分卡,解析页面的“标题”(即记分卡)。
但我无法获取使用“firebug”时可以看到的评论,但是当我获取页面时,这些评论不会显示。
反正有没有用命令行使用萤火虫? (想知道我是否可以,然后我可以获取这些结果。)
或者获取那些自动更新评论的方法是什么?
【问题讨论】:
-
wget espncricinfo.com/wcldiv4-2012/engine/match/576414.html cat 576414.html | grep "" | sed 's/]*>//g'
-
不,不是这个。 .您尝试从 espncricinfo 获取数据的那个。 .
-
那是我获得记分卡的帮助。我没有写任何东西来获得评论,因为当我 wget 时,我没有在获取的页面中得到它。
-
该页面必须已经加载了 JavaScript。您应该尝试查看 js 在做什么,并尝试 wget 它从哪里获取您需要的数据。