【问题标题】:Parsing a specific element using JSoup使用 JSoup 解析特定元素
【发布时间】:2020-06-01 02:19:39
【问题描述】:

我想知道是否有人熟悉解析网站 HTML 的特定部分,例如使用 JSoup 从网站获取当前温度或当前条件?我已经搜索过了,似乎所有的例子都是人们使用每个循环来提取一个列表。例如在我附上的图片中,我只想将 -3 度解析到我的 IDE 中。任何帮助将不胜感激!谢谢!

图片:

【问题讨论】:

  • 好吧,我认为无论如何 JSoup 都会为您提供网页的完整 HTML 文档。你基本上需要在这个文档中找到你需要的标签。因此,您应该大致知道它的位置。例如,在第一个
    的内部和第二个
    的内部...等等,一直到您要查找的元素。另一方面,您可以尝试简单地在文档中搜索“°C”字符串,但这当然不是很安全:)
  • 您要从哪个网址获取此信息?
  • 嘿乔纳森,那张图片来自 grousemountain.com,我成功地将温度解析到我的 IDE 中,但是当我尝试从 whistlerblackcomb.com/the-mountain/mountain-conditions/… 执行此操作以获取当前温度时,它总是由于某种原因给了我一个错误。也许惠斯勒网站的设置不同?你知道有什么方法可以检索惠斯勒网站的数据吗?谢谢!

标签: java html parsing intellij-idea jsoup


【解决方案1】:

您应该能够使用标准选择器从Document.select() 方法中获取您想要的数据。最简单的方法是在浏览器的检查器中打开网页,专门检查该元素,然后在元素查看器中上下文单击其节点并选择复制 -> 选择器路径。

就个人而言,我在使用 JSoup 时遇到了相当大的麻烦,并且发现注入 artoo.js 通常是一种更快的方法,可以从页面中获取我想要的内容,而不管环境如何。

【讨论】:

    猜你喜欢
    相关资源
    最近更新 更多
    热门标签