【发布时间】:2015-10-03 00:28:31
【问题描述】:
Java 中是否有一种方法可以向网页发出 HTTP 请求,其中响应只会是我想要的某些特定元素而不是整个文档?
例如,如果我要请求一个名为 "example" 的 <div>,则响应将仅是该元素,而不是页面上存在的其余绒毛,我不需要。
我看过的大多数方法都涉及获取整个 HTML 页面,然后对其进行解析。我想查看该页面,然后只需取出我想要的 div 并仅将其作为响应。我正在处理的页面包含很多我想忽略的广告内容。
【问题讨论】:
标签: java html http dom web-scraping