【问题标题】:How to include line breaks and bullet points when scraping with node.js?使用 node.js 抓取时如何包含换行符和项目符号?
【发布时间】:2021-09-05 19:22:00
【问题描述】:

当抓取Glassdoor job page的描述时,结果为 $("#JobDescriptionContainer").text() 返回没有换行符、新段落或项目符号的文本字符串。有什么方法可以抓取描述,使返回的结果与网站上的格式相同,而不仅仅是纯无格式的文本?

【问题讨论】:

  • 试试 .innerHTML() 或 .html()
  • 谢谢,它有效。但是当它被保存在 MongoDB 中时,它是一大串没有中断的文本。你知道为什么吗?

标签: jquery node.js web-scraping


【解决方案1】:

请使用 .html() 而不是 .text()

$("#JobDescriptionContainer").html()

【讨论】:

  • 谢谢,工作!但是,后来当它保存在 MongoDB 中时,它变成了一个不间断的大字符串 - 你知道如何以正确的格式将它存储在 mongoDB 中吗?
猜你喜欢
  • 1970-01-01
  • 2019-03-14
  • 2021-05-04
  • 1970-01-01
  • 1970-01-01
  • 2012-01-11
  • 1970-01-01
  • 1970-01-01
  • 2016-12-08
相关资源
最近更新 更多