【发布时间】:2017-05-10 07:17:51
【问题描述】:
我正在收到一个网页的评论,我需要扫描每个页面,直到没有评论为止。评论页面有多个页面,我的第一个想法是使用 While 循环,但是,我不确定从哪里开始。网页的 HTML 代码看起来与此类似。
感谢任何帮助。
【问题讨论】:
-
显示到目前为止您尝试过的代码。也分享最后一页的
HTML -
检查 URL 是否有页面作为参数。如果是这样,您不需要使用下一步按钮。对于解析html,我建议BeautifulSoup
-
URL 没有页面参数。我想不出循环的东西。非常欢迎任何代码建议。 @安德森
-
在最后一页显示
HTML代码Next按钮 -
在最后一页上,下一个按钮不存在,因此没有相应的 HTML 代码。我刚刚编辑了我的问题并添加了最后一页的 html 代码。 @安德森
标签: python python-2.7 selenium beautifulsoup