【发布时间】:2015-07-29 20:30:18
【问题描述】:
我正在使用 jSoup 抓取一个网站,以从它显示的广告中获取信息。大多数广告都包含共同的元素,但对于一些广告来说,它们是缺失的。我正在尝试抓取所有广告,同时包括那些不具有共同元素的广告,但我正在努力。以下是我所掌握的基础知识:
Elements gene = doc.select("div.item");
for (Element c : gene) {
Elements monk1 = c.select("li.cool");
Elements monk2 = c.getElementsByAttributeValueContaining("src", "/images/notthere.gif");
if (monk1.isEmpty()) {
monk1 = monk2;
}
String[] price = {monk1.text()};
model1.setValueAt(price[0], xf, 2);
xf++;
xf++;
}
它在 HTML 中的元素“基因”中查找元素。 “li.cool”存在于大多数“基因”元素中,但对于某些元素来说它是缺失的。对于每次缺少“li.cool”,我想用一个简单的字符串替换空元素。我该怎么做呢??
【问题讨论】:
标签: java replace jsoup element elements