【问题标题】:Extracting images from a webpage under a specific tag从特定标签下的网页中提取图像
【发布时间】:2012-06-28 23:46:33
【问题描述】:

我想知道如何提取网页中特定标签下的所有图像。例如 如果是在:

<div class="img-style">
<img src="http://blah.../x.jpg">     

我想使用 JAVA 提取该特定 div 类下的所有图像。是否可以,任何帮助将不胜感激

【问题讨论】:

  • “我想要..” ..一匹小马。 What have you tried?我的意思是除了请互联网上的随机陌生人为你做这件事。
  • 见上文,你尝试过什么?
  • 好吧,我的问题框架不正确。对不起。我从来没有处理过 HTML 解析,所以我只是想知道如何做。任何例子都足够了:)
  • 服务器?有什么特别的框架吗?图书馆?你想达到什么目的?为什么需要这样做?请发布您的问题的完整背景。
  • “任何示例都足够了” 但是指向 API 的链接(可能有示例)不足以让您进入询问特定的阶段 问题?如果我还没有这样做,我会投票关闭!

标签: java html web html-parsing web-scraping


【解决方案1】:

我喜欢这个用于抓取互联网的图书馆http://jsoup.org/。我在大约 30 分钟内启动并运行了一个解析器,而我在业余时间只写了 3 个月的 java。

【讨论】:

    【解决方案2】:

    这里还有其他很棒的 Java 的 HTML 抓取库:TagSoupHTMLUnitWeb-Harvest。使用库会比从头开始使用自己的库更快、更容易。下次提供一些你也尝试过/看过的方法

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2011-12-03
      • 2021-10-01
      • 1970-01-01
      • 1970-01-01
      • 2013-02-04
      • 1970-01-01
      • 2015-03-15
      相关资源
      最近更新 更多