【问题标题】:Getting Text and Images from external web page从外部网页获取文本和图像
【发布时间】:2018-10-29 09:16:39
【问题描述】:

我阅读了许多关于如何在我们的外部网站(这是我们公司的内部网络)中获取 LinkedIn 最近更新的文章。现在,任何用户都可以查看这些最近的更新。例如,如果有人访问我们的 LinkedIn 帐户(其中 url 类似于https://www.linkedin.com/company/OurCompany***),那么他们可以查看最近的更新,而无需登录 LinkedIn。 但似乎 LinkedIn 没有提供任何 API 可以让我们获取这些最近的更新,除非用户已经登录到 LinkedIn(这在我们的例子中不起作用)。我也在搜索类似于 RSS 提要的东西,但似乎 LinkedIn 不提供任何 RSS 提要..

所以我正在考虑是否可以通过以下步骤获得这些最近的更新:-

  1. 使用 JavaScript 获取我们 LinkedIn 帐户网页的源代码@https://www.linkedin.com/company/OurCompany***
  2. 然后获取最近更新的文本和图像标记。
  3. 在我们的网站内显示文本和图像标记。

所以我不确定以上 3 个步骤是否适合我?

【问题讨论】:

    标签: javascript jquery html


    【解决方案1】:

    这不起作用,因为浏览器内部的 javascript 不允许使用 XHR 向其他域发出 HTTP 请求,除非它们具有 Access-Control-Allow-Origin 标头集,LinkedIn 不会这样做,因为抓取他们的网页违反了他们的服务条款.

    见:Cross Origin Resource Sharing (CORS)

    【讨论】:

    • 感谢您的回复,请问有什么方法可以让我从外部网页获取图像和文本的标记吗?除了使用 API 或 RSS 提要?
    • @testtest 您可以让自己的服务器请求这些项目并忽略跨域标头,然后让浏览器中的 javascript 查询您自己的服务器以获取这些图像和文本。
    • 所以你的意思是我不能只依赖 JavaScript?我需要编写一些服务器端代码吗?
    猜你喜欢
    • 1970-01-01
    • 2014-01-24
    • 2011-12-21
    • 2018-09-28
    • 1970-01-01
    • 1970-01-01
    • 2011-08-05
    • 2011-09-26
    • 1970-01-01
    相关资源
    最近更新 更多