如何从站点 HTML 中解析特定字符串答案

【问题标题】：How to parse specific string from site HTML如何从站点 HTML 中解析特定字符串
【发布时间】：2017-09-09 00:20:18
【问题描述】：

我从 Stackoverflow 发现我可以使用 Jsoup 轻松解析网站。

例如，我可以编写以下代码来解析来自维基百科网站的新闻标题。

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

我的问题来了。如果我想解析这个网站https://campusoperations.temple.edu/parking-transportation/garages-lots?campus=4，抓取停车场的地址字符串并放入字符串变量中，所以我终于有了像

这样的字符串变量

String fifteenStreetLot = "1855 N. 15th Street Philadelphia, PA 19122"
String bellGarage = "1840 N. 11th Street Philadelphia, PA 19122"

我应该写什么代码？

当我使用 chrome 的“更多工具”>“开发者工具”打开 html 文件时，似乎找不到相应的 HTML 元素。

为了您更好的理解，我不想手动输入“1855 N. 15th Street Philadelphia, PA 19122”。我想从网站上解析出那个字符串，最后得到一个字符串：String fifteenStreetLot = "1855 N. 15th Street Philadelphia, PA 19122";

【问题讨论】：

标签： java parsing jsoup html-parsing text-parsing

【解决方案1】：

起初我可以在您的链接上看到下一个：

<div class="thoroughfare">1840 N. 11th Street</div>
<div class="addressfield-container-inline locality-block country-US"><span class="locality">Philadelphia</span>, <span class="state">PA</span> <span class="postal-code">19122</span></div>

使用 css 选择器，如

div.thoroughfare

和

div.adressfield-container-inline

你可以得到你需要的部分。

【讨论】：