【发布时间】:2016-04-08 18:13:56
【问题描述】:
我正在做一些个人数据科学项目,其中之一是查看某些歌曲在收音机中播放的频率。
http://www.iheart.com/live/radio-1045-3401/
查看上面的 URL,当我查看页面源时,没有填充感兴趣的值。不知道为什么,但是当我将鼠标悬停在“正在播放”标题上时,当我在 chrome 中使用检查元素时,我可以看到正在播放的歌曲和艺术家的值。
例子:
a class="player-song" href="/artist/rem-3610/songs/-2450662/" title="Losing My Religion" data-reactid=".1hpdfx1l4ow.a.1.0.1.1">Losing My Religion</a
我的两个问题是:
- 为什么它没有显示在页面源代码中,但我可以在 Inspect Element 下看到它?
- 由于此信息未出现在页面源中,我将如何通过网络抓取该信息?
【问题讨论】:
-
还没有检查,但它可能是由javascript生成的内容,在这种情况下你可以在python中使用selenium
-
您也可以使用他们的 API 获取数据。developer.iheart.com/Api/login
标签: javascript python html r web-scraping