【发布时间】:2019-04-13 10:01:38
【问题描述】:
我目前有一个简单的网页,它只包含一个 .js、.css .html 文件。我不想使用任何 Node.js 的东西。
关于这些限制,我想问一下是否可以使用 javascript 搜索外部网页的内容(例如,在后台运行 webworker)。
例如我想做:
获取 google 图片搜索的第一个 url 链接。
编辑:
我现在试了一下,发现它工作正常,但是 2 周后我现在得到这个错误:
跨域请求被阻止:同源策略不允许读取位于...的远程资源。 (原因:CORS 标头“Access-Control-Allow-Origin”缺失)。
有什么办法解决这个问题吗?
这是firefox描述的错误: https://developer.mozilla.org/en-US/docs/Web/HTTP/CORS/Errors/CORSMissingAllowOrigin
【问题讨论】:
-
如果您尝试抓取的网站不支持 CORS,则如果没有服务器代理请求,您将无法绕过该问题。
标签: javascript html web-scraping web-worker