【问题标题】:Parse the contents of a webpage解析网页内容
【发布时间】:2017-03-19 07:24:47
【问题描述】:

我正在为我的部门创建html 页面。只是htmlcss 没什么特别的。现在,我们正在尝试从另一个网页获取数据,以显示在我们正在处理的新网页中。我假设我需要使用JavaScript 和某种解析器,但我不确定如何执行此操作或真正要搜索什么。

我认为存在的解决方案是有一个函数,向它提供我们想要挖掘的网页的链接,它会返回(例如)某个单词在该网页中重复的次数。

【问题讨论】:

  • 是的,你需要 javascript。这也是同一域上的其他网页吗?
  • 是的。我相信它在同一个域上。关于如何使用 JavaScript 做到这一点的任何示例?

标签: javascript html parsing webpage


【解决方案1】:

最好的方法是使用node.js,然后安装cheerio(解析器)和请求(http请求)模块。有很多详细的教程展示了如何做到这一点(例如this one at digital ocean)。

但是,如果您不想设置 nodejs 并希望使用普通的 Web 设置。然后,下载cheerio并请求js库并将它们包含在您的html页面中的标签中,然后按照上面的示例进行操作。希望对你有帮助。

【讨论】:

  • 我会调查cheerios。但我无法安装 npm。
  • 安装时遇到什么问题?
  • 我无法安装,因为我使用的是不允许安装此类库的公司工作站。
猜你喜欢
  • 2013-04-23
  • 2017-08-01
  • 1970-01-01
  • 2017-03-24
  • 1970-01-01
  • 1970-01-01
  • 2012-08-19
  • 2021-11-28
  • 1970-01-01
相关资源
最近更新 更多