【发布时间】:2014-10-07 07:36:03
【问题描述】:
我正在尝试从http://fortune.com/fortune500 中获取公司信息以用于我的论文。当我从链接下载 web_text 时,没有用于解析的链接。但是,在 Chrome 上打开链接会自动转到 #1 公司页面。
有人可以帮我解释发生了什么,以及如何从原始 url 跟踪到公司页面的链接吗?
【问题讨论】:
-
这是一个动态加载的网站。从链接加载文本后,您不会获得所有公司。
-
感谢 Krono 的评论。我刚发现也是一样。我正在搜索包含公司详细信息的财富 500 强名单。你有什么建议吗?
标签: python web-scraping html-parsing