【发布时间】:2011-10-31 03:39:05
【问题描述】:
假设我有一个这样的 div:
<div>
This is a paragraph
written by someone
on the internet.
</div>
问题是,当 JSoup 解析这个时,它把它全部放在一行上,所以当我调用 text() 时它会这样读取:
This is a paragraphwritten by someoneon the internet.
现在,我意识到这并不是真正的 JSoup 问题,因为实际的 html 不包含空格。但是,有什么方法可以使用 JSoup(可能是一些覆盖或我没见过的选项),以便在解析时在行之间添加一个空格?我想这一定是可能的(因为我可以在 Chrome 中检查元素并取消选择自动换行,它会得到我想要的)但我不确定 JSoup 是否可以做到这一点。
有什么想法吗?
【问题讨论】:
标签: java dom screen-scraping jsoup