【发布时间】:2013-10-06 03:50:05
【问题描述】:
我想获取标签内的文本。我知道它的 id,即“lblCompra”和“lblVenta”。
Document doc = Jsoup.connect("http://www.bccr.fi.cr//").get();
Element compra = doc.getElementById("lblCompra");
Element venta = doc.getElementById("lblVenta");
System.out.println(compra);
System.out.println(venta);
但我得到的是一堆我不需要的文本。这是输出:
<span id="lblCompra"> <img src="images/waiting.gif" alt="cargando" /> </span>
<span id="lblVenta"> <img src="images/waiting.gif" alt="cargando" /> </span>
我应该得到的是“400.0”和“450.0”或类似的东西。
【问题讨论】:
-
为什么你期望 gettig 400 或 450 而在 span 标签中有图像?
-
你从这个网址bccr.fi.cr得到什么?
-
网站的实际 HTML 代码状态为 '493,51' 但我得到的是 gif 图像。身份证:s
-
@anulik 我正在尝试获取右中面板的前 2 个数字。在“tipo de cambio y taza”下方
-
我认为关键在于该网页中的信息是通过 AJAX 加载的,这就是为什么你会得到这张图片 bccr.fi.cr/images/waiting.gif ,如果内容是用 AJAX 来的,那就不可能了在 SEO 中也看到了原因,AJAX 上下文不再被索引,我这么认为