【发布时间】:2017-05-09 07:45:31
【问题描述】:
我正在尝试从该网站上抓取所有新闻项目。它们没有显示在源代码中:http://www.uvm.dk/aktuelt
我尝试过使用 Firefox 的 LIVE Http Headers 和 Chrome 的开发者工具,但仍然无法弄清楚幕后发生了什么。我敢肯定这很简单:-)
我有这些信息,但我如何使用它们来抓取想要的新闻?
请求方法:POST
连接:保持活动状态 PageId=8938bc1b-a673-4513-80d1-e1714ca93d7c&Term=&Years%5B%5D=2017&WorkAreaIds=&SubjectIds=&TemplateIds=&NewsListIds%5B%5D=Emner&TimeSearch%5BEvaluation%5D=&FlagSearch%5BEvaluation%5D=Alle&Department&=LRootNames=&Letters= da&PageSize=10&Page=1
谁能帮忙?
【问题讨论】:
-
也许贴一些代码?
标签: python api search web-scraping