【发布时间】:2016-11-16 20:00:13
【问题描述】:
我要从网页上抓取数据:https://www.youtube.com/playlist?list=PLMC9KNkIncKtPzgY-5rmhvj7fax8fdxoj
页面末尾有一个“加载更多”按钮,用于加载更多视频。
此页面仅显示 100 个视频,但我想在单击“加载更多”按钮后解析数据。
<button class="yt-uix-button yt-uix-button-size-default yt-uix-button-default load-more-button yt-uix-load-more browse-items-load-more-button" type="button" onclick=";return false;" aria-label="Load more
" data-uix-load-more-target-id="pl-load-more-destination" data-uix-load-more-href="/browse_ajax?action_continuation=1&continuation=4qmFsgIuEiRWTFBMTUM5S05rSW5jS3RQemdZLTVybWh2ajdmYXg4ZmR4b2oaBkNHVSUzRA%253D%253D"><span class="yt-uix-button-content"> <span class="load-more-loading hid">
<span class="yt-spinner">
<span class="yt-spinner-img yt-sprite" title="Loading icon"></span>
Loading...
</span>
</span>
<span class="load-more-text">
Load more
</span>
</span></button>
我可以这样做吗?我用漂亮的汤
编辑:找到2个解决方案。一个使用 beautifulsoup,另一个使用 selenium。
【问题讨论】:
标签: python-2.7 web-scraping beautifulsoup