【发布时间】:2021-08-02 08:10:45
【问题描述】:
我正在尝试使用 JSoup (1.13.1) 从 HTML 页面中的配方中获取脚本标记(JSON 数据)中的内容。我不会发布 HTML 代码,但脚本标签内容很大。
每当我尝试打印内容时,都会得到一个空字符串。我尝试使用不同的方法获取我的数据:选择 ID doc.select("#__NEXT_DATA__"),或使用 doc.select("script[type='application/json']")
如果我尝试遍历所有脚本标签,只要它到达我想要的脚本标签,它就会打印空白。
我还尝试使用text() 方法和toString() 方法打印内容,但它不起作用。我什至看到有人说你可以设置maxBodySize(0),但它仍然不起作用。
这是我的代码:
String url = "https://www.marmiton.org/recettes/recette_gateau-au-chocolat-fondant-rapide_166352.aspx";
doc = Jsoup.connect(url).maxBodySize(0).get();
Elements newsHeadlines = doc.select("#__NEXT_DATA__");
for (Element element : newsHeadlines) {
System.out.println(element);
}
【问题讨论】: