【问题标题】:How to get html/text from webpage [duplicate]如何从网页中获取 html/文本 [重复]
【发布时间】:2014-05-22 13:51:53
【问题描述】:

我想获取此页面上的文本: https://cvo-v025.cvo-zwfryslan.nl/display/ToonBerichten.aspx?uid=ctl14&pid=723df4e4-248f-4df6-b3ad-751b410daab7&id=1c76d69d-d858-44d9-8a47-e65e9f294898

Php cUrl 不工作,YQL 不工作(但没有报错),javascript 不工作,错误信息是:

XMLHttpRequest cannot load https://cvo-v025.cvo-zwfryslan.nl/display/ToonBerichten.aspx?uid=ctl14&pid=…3df4e4-248f-4df6-b3ad-751b410daab7&id=1c76d69d-d858-44d9-8a47-e65e9f294898. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://--------.nl' is therefore not allowed access. 

有没有办法让我从该页面获取文本?

【问题讨论】:

  • 一个简单的复制粘贴到你的应用中?
  • 您无法通过 javascript 从其他服务器获取数据。那将是一个跨站点请求,出于安全原因,它们被阻止了。
  • 您的问题缺少任何可能帮助人们确定您尝试使用 PHP+cURL 或 YQL 失败的原因的信息。您的第三种方法可以通过重复的问题来处理。

标签: javascript php html yql


【解决方案1】:

您尝试从中获取文本的页面实际上向另一个资源发出 POST 请求以通过 XHR 获取文本。当您打开 Firebug 或类似软件时,您应该会看到 POST 请求、其 URL 和响应。您似乎需要在站点上建立一个会话才能实际获取任何内容,因为向该 URL 发出 POST 请求无法检索到任何有用的内容。

将请求复制为 CURL 确实会产生一个有效的终端命令以及所有发送的标头,但我怀疑如果您希望以编程方式执行此操作会有所帮助。

【讨论】:

    猜你喜欢
    • 2017-01-16
    • 2010-12-08
    • 1970-01-01
    • 2014-01-07
    • 2011-09-26
    • 2019-06-27
    • 2010-09-09
    • 2012-10-13
    • 1970-01-01
    相关资源
    最近更新 更多