【问题标题】:How to parse specific string from site HTML如何从站点 HTML 中解析特定字符串
【发布时间】:2017-09-09 00:20:18
【问题描述】:

我从 Stackoverflow 发现我可以使用 Jsoup 轻松解析网站。

例如,我可以编写以下代码来解析来自维基百科网站的新闻标题。

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

我的问题来了。 如果我想解析这个网站https://campusoperations.temple.edu/parking-transportation/garages-lots?campus=4,抓取停车场的地址字符串并放入字符串变量中,所以我终于有了像

这样的字符串变量
String fifteenStreetLot = "1855 N. 15th Street Philadelphia, PA 19122"
String bellGarage = "1840 N. 11th Street Philadelphia, PA 19122"

我应该写什么代码?

当我使用 chrome 的“更多工具”>“开发者工具”打开 html 文件时,似乎找不到相应的 HTML 元素。

为了您更好的理解, 我不想手动输入“1855 N. 15th Street Philadelphia, PA 19122”。我想从网站上解析出那个字符串,最后得到一个字符串:String fifteenStreetLot = "1855 N. 15th Street Philadelphia, PA 19122";

【问题讨论】:

    标签: java parsing jsoup html-parsing text-parsing


    【解决方案1】:

    起初我可以在您的链接上看到下一个:

    <div class="thoroughfare">1840 N. 11th Street</div>
    <div class="addressfield-container-inline locality-block country-US"><span class="locality">Philadelphia</span>, <span class="state">PA</span> <span class="postal-code">19122</span></div>
    

    使用 css 选择器,如

    div.thoroughfare
    

    div.adressfield-container-inline 
    

    你可以得到你需要的部分。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-01-13
      • 2011-04-05
      • 2012-08-30
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-01-05
      相关资源
      最近更新 更多