【问题标题】:How to get content of <img src=> from body如何从正文中获取 <img src=> 的内容
【发布时间】:2020-12-14 04:30:05
【问题描述】:

所以,我有一个 Tumblr API 的链接,它提供带有给定标签的标记帖子 (https://api.tumblr.com/v2/tagged?api_key=blablabla&amp;tag=red)

This 来自请求的响应。

我只想获取 &lt;img src =&gt; 的内容,我只想要里面的链接,当我发出 get 请求时,它会加载整个内容,我尝试过 puppeteer、fetch、document.getelementbyId("node js is screaming"),但失败了。 .

我怎样才能得到&lt;img src&gt;中的链接

【问题讨论】:

  • 堆栈溢出不是代码编写服务。有很多关于如何在 Google 上抓取网站的信息。选择一个实现,尝试一下,如果您需要帮助,请回来向我们展示您的代码。
  • 这能回答你的问题吗? Extract image src from a string

标签: javascript node.js


【解决方案1】:

获取响应,然后使用regex 扫描它以获取img 标记。

例子:

var response = 'your code response here'
var regex = /<img(.*?)>/g;
var imgtags = response.match(regex);
console.log(imgtags //);`

现在,imgtags 包含所有以“img”开头的标签,您可以使用任意逻辑(包括另一个自定义 regex)来选择您需要的标签。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-06-02
    • 1970-01-01
    • 1970-01-01
    • 2013-04-17
    • 2016-05-01
    • 2021-05-27
    • 1970-01-01
    相关资源
    最近更新 更多