【发布时间】:2016-08-12 17:17:08
【问题描述】:
我正在尝试从 URL 中抓取附图中表格中的价格和日期:**** http://www.airfrance.fr/vols/paris+tunis
我成功地抓取了信息,但不是我正在寻找的方式(日期 + 价格)。我用了这几行代码
import java.io.IOException;
import javax.lang.model.element.Element;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
public class Test {
public static void main(String[] args) {
Document doc;
try {
doc = Jsoup.connect("http://www.airfrance.fr/vols/paris+tunis").get();
Elements links = doc.select("div");
for (org.jsoup.nodes.Element e:links) {
System.out.println(e.text());
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
运行这段代码只给了我一些价格和几个日期,但不是所有表格,如下图所示。
你能帮我解决我的学习项目的这个问题吗?谢谢。
【问题讨论】:
标签: java web-scraping web-crawler jsoup