【发布时间】:2021-09-05 19:22:00
【问题描述】:
当抓取Glassdoor job page的描述时,结果为
$("#JobDescriptionContainer").text() 返回没有换行符、新段落或项目符号的文本字符串。有什么方法可以抓取描述,使返回的结果与网站上的格式相同,而不仅仅是纯无格式的文本?
【问题讨论】:
-
试试 .innerHTML() 或 .html()
-
谢谢,它有效。但是当它被保存在 MongoDB 中时,它是一大串没有中断的文本。你知道为什么吗?
标签: jquery node.js web-scraping