【发布时间】:2015-05-22 13:46:52
【问题描述】:
我编写了一个从网站中提取信息的 java 代码。有一个表只有在单击时才会触发(片段?我是 HTML 新手)。我尝试通过网站的 HTML 查找 id,但没有找到。就像我说的,它只在点击时显示在 HTML 上。我正在考虑保持 URL 连接打开足够长的时间以触发元素,然后提取信息。我该怎么办?
到目前为止,我的程序提取了链接之前页面上给出的信息。
【问题讨论】:
标签: java html urlconnection
我编写了一个从网站中提取信息的 java 代码。有一个表只有在单击时才会触发(片段?我是 HTML 新手)。我尝试通过网站的 HTML 查找 id,但没有找到。就像我说的,它只在点击时显示在 HTML 上。我正在考虑保持 URL 连接打开足够长的时间以触发元素,然后提取信息。我该怎么办?
到目前为止,我的程序提取了链接之前页面上给出的信息。
【问题讨论】:
标签: java html urlconnection
我的第一印象是该站点使用 javascript 来加载该特定表。很可能,HTML 解析器不会在页面上执行 javascript,因此您将无法获得任何动态内容。在 java 中执行 javascript 可能会很棘手,但是有几种启动路径,请参阅:
Parsing web page containing dynamic javascript objects
另一种方法是手动分析页面,找出特定 js 代码的作用,并尝试在您的 java 代码中复制它。
【讨论】: