【问题标题】:Trying to get links of an interactive map (Web scraping .swf)尝试获取交互式地图的链接(Web 抓取 .swf)
【发布时间】:2017-04-01 08:40:59
【问题描述】:

我需要为此 website 创建一个网络爬虫

但是我需要获取县的链接,存储在interactive map

不幸的是,由于某种原因,他们的搜索引擎并没有像交互式地图那样提供所有结果。

我的问题: 谁能告诉我如何在不手动访问的情况下获取所有县的所有链接?

谢谢

【问题讨论】:

  • 请阅读How to Ask。请提供您尝试过的代码和执行结果,包括任何错误信息等。
  • 从该站点抓取数据违反了他们的服务条款...不要这样做。

标签: python selenium flash beautifulsoup


【解决方案1】:

从技术上讲,您可以使用反编译器来完成这项工作。

有免费(例如:ActionScript Extractor)和付费(例如:Sothink SWF Decompiler) 工具。

你可以参考这个answer


编辑: 大多数 swf 内容从 .xml.json 文件获取外部记录。

无需反编译,只需使用浏览器的开发者工具,我们就可以看到确实访问了一个 xml 文件(也许它包含您想要的内容):

http://www.allpetservices.co.uk/uk_ir_locator.xml.
view-source:放在链接前面阅读它(如果有错误消息)。

在该 xml 中,您要提取每个和每个 <link> xyz </link> 标记的内容(xyz)。这将为您提供地图上每个条目的链接

【讨论】:

  • 希望您不要介意编辑。决定只更新你的而不是做出新的答案。
【解决方案2】:

对您的问题的简短回答:无法从网站获取链接。

解决方案:您尝试检索的链接的结构非常可预测。它们遵循相同的结构: http://www.allpetservices.co.uk/search_map.asp?ccounty={COUNTY_NAME}

因此,如果您可以使用其他网站或数据源来获取每个县的名称,您就可以制定您需要的每个链接。

【讨论】:

  • 已经想到了,但是有些网站的县名不准确,所以我还是要手动从网站上获取县名。
猜你喜欢
  • 2021-05-19
  • 1970-01-01
  • 1970-01-01
  • 2015-08-12
  • 2019-04-26
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多