【问题标题】:Getting resources folder of a web site in java在java中获取网站的资源文件夹
【发布时间】:2016-01-13 15:44:51
【问题描述】:

我正在开发一个应用程序来从 instagram 下载照片,例如: 如果我将此 uri 放在应用程序 https://www.instagram.com/p/BASqNR9wrKp/ 上,它会将图像下载到我的计算机上。 我现在想要实现的是通过instagram页面的链接(例如:https://www.instagram.com/microsoft/?hl=it)并下载该页面上的所有照片,我该如何实现?

我以为我可以从 instagram 的 Frames 文件夹中访问这些图像,但我不知道该怎么做,有人可以帮助我吗?有什么建议吗? 这是我试图通过 java 访问的文件夹的图像。

【问题讨论】:

    标签: java resources instagram downloading-website-files


    【解决方案1】:

    您需要的就是所谓的网络爬虫。我能想到的最简单的 Java 是 Crawler4J,对于您的具体情况,他们的 Image Crawler

    【讨论】:

    • 所以我无法直接访问该文件夹?
    • 它不是一个真正的文件夹,浏览器只是显示分组的图像。
    • 它从哪里获得这些图像?
    • 它们引用自以下来源:1) HTML 文件 2) 加载的 CSS 文件 3) 加载的 javascript 文件。大多数情况下,它们将从具有网页的同一服务器(在本例中为 Instagram)获取。
    猜你喜欢
    • 2016-08-06
    • 2016-02-11
    • 2017-03-23
    • 1970-01-01
    • 1970-01-01
    • 2017-05-18
    • 2017-12-08
    • 1970-01-01
    相关资源
    最近更新 更多