【问题标题】:HttpClient Request like browserHttpClient 请求类似浏览器
【发布时间】:2013-02-08 05:37:48
【问题描述】:

当我通过 HttpClient 类调用网站 www.livescore.com 时,我总是收到错误“500”。 可能是服务器阻止了来自 HttpClients 的请求。

1)还有其他方法可以从网页中获取html吗?

2)如何设置标题以获取 html 内容?

当我像在浏览器中一样设置标题时,我总是得到 stange 编码的内容。

    http_client.DefaultRequestHeaders.TryAddWithoutValidation("Accept", "text/html,application/xhtml+xml,application/xml");
    http_client.DefaultRequestHeaders.TryAddWithoutValidation("Accept-Encoding", "gzip, deflate");
    http_client.DefaultRequestHeaders.TryAddWithoutValidation("User-Agent", "Mozilla/5.0 (Windows NT 6.2; WOW64; rv:19.0) Gecko/20100101 Firefox/19.0");
    http_client.DefaultRequestHeaders.TryAddWithoutValidation("Accept-Charset", "ISO-8859-1");

3) 我该如何解决这个问题?有什么建议吗?

我在 C# 和 HttpClientClass 中使用 Windows 8 Metro Style App

【问题讨论】:

  • 当您使用浏览器获取此网址时会发生什么?
  • 在浏览器页面显示正确。看看livescore.com
  • 你能发布整个函数吗?

标签: c# windows-8 http-headers


【解决方案1】:

给你 - 注意你必须解压缩你得到的 gzip 编码结果as permleroy:

private static readonly HttpClient _HttpClient = new HttpClient();

private static async Task<string> GetResponse(string url)
{
    using (var request = new HttpRequestMessage(HttpMethod.Get, new Uri(url)))
    {
        request.Headers.TryAddWithoutValidation("Accept", "text/html,application/xhtml+xml,application/xml");
        request.Headers.TryAddWithoutValidation("Accept-Encoding", "gzip, deflate");
        request.Headers.TryAddWithoutValidation("User-Agent", "Mozilla/5.0 (Windows NT 6.2; WOW64; rv:19.0) Gecko/20100101 Firefox/19.0");
        request.Headers.TryAddWithoutValidation("Accept-Charset", "ISO-8859-1");

        using (var response = await _HttpClient.SendAsync(request).ConfigureAwait(false))
        {
            response.EnsureSuccessStatusCode();
            using (var responseStream = await response.Content.ReadAsStreamAsync().ConfigureAwait(false))
            using (var decompressedStream = new GZipStream(responseStream, CompressionMode.Decompress))
            using (var streamReader = new StreamReader(decompressedStream))
            {
                return await streamReader.ReadToEndAsync().ConfigureAwait(false);
            }
        }
    }
}

这样调用:

var response = await GetResponse("http://www.livescore.com/").ConfigureAwait(false); // or var response = GetResponse("http://www.livescore.com/").Result;

【讨论】:

  • 没有“Accept-Encoding”标头是否可以达到同样的效果?
【解决方案2】:

也可以尝试添加压缩支持:

var compressclient = new HttpClient(new HttpClientHandler() 
{ 
AutomaticDecompression = DecompressionMethods.Deflate | DecompressionMethods.GZip 
}); 

这也会添加标题。

根据相同的线程支持现在在 Windows Store 框架中:http://social.msdn.microsoft.com/Forums/windowsapps/en-US/429bb65c-5f6b-42e0-840b-1f1ea3626a42/httpclient-data-compression-and-caching?prof=required

【讨论】:

    【解决方案3】:

    有几点需要注意。

    1. 该网站要求您提供用户代理,否则会返回 500 HTTP 错误。

    2. 对livescore.com 的GET 请求以302 响应livecore.us。你需要处理重定向或者直接请求livescore.us

    3. 您需要解压缩 gzip 压缩的响应

    此代码使用 .NET 4 客户端配置文件,我会让您确定它是否适合 Windows 应用商店应用程序。

    var request = (HttpWebRequest)HttpWebRequest.Create("http://www.livescore.com");
    request.AllowAutoRedirect = true;
    request.UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.57 Safari/537.17";
    
    string content;
    
    using (var response = (HttpWebResponse)request.GetResponse())
    using (var decompressedStream = new GZipStream(response.GetResponseStream(), CompressionMode.Decompress))
    using (var streamReader = new StreamReader(decompressedStream))
    {
        content = streamReader.ReadToEnd();
    }
    

    【讨论】:

    • OP 没有使用HttpWebRequest,而是使用HttpClient。但是您对第 1 点和第 3 点很了解。
    • 你是对的;好吧,OP 似乎并没有打算使用 HttpClient (请参阅他的第一个问题),所以希望它仍然有用:)
    • 谢谢!是个好答案,但在 Winodws 8 中仅支持 HttpClient。
    【解决方案4】:

    我认为您可以肯定他们已经尽一切努力阻止开发人员进行屏幕抓取。

    如果我使用此代码从标准 C# 项目中尝试:

      var request = WebRequest.Create("http://www.livescore.com ");
      var response = request.GetResponse();
    

    我收到以下回复:

    The remote server returned an error: (403) Forbidden.
    

    【讨论】:

    • 是的,我知道 :) 但我们是开发人员,我们需要解决这样的问题 :)
    • 那里有付费服务。这是非法的黑客行为。也许你应该找到另一个网站。
    • 非法?为什么?当你通过浏览器调用本站也是非法的?
    • Livescores 是一项大生意,大多数网站都有您可以付费购买的联合交易或 xml 提要。
    • 在未经他人许可的情况下复制他人的数据通常被认为是非法的,尽管大多数网站在其服务条款或使用政策中也涵盖了这一点,而我在 livecore.com 上也找不到。我仍然建议您联系该网站并为您的项目请求许可,如果他们有自己的 API/Feed 可以使用。
    猜你喜欢
    • 1970-01-01
    • 2012-06-25
    • 1970-01-01
    • 2014-01-28
    • 2020-07-28
    • 2015-03-09
    • 1970-01-01
    • 2023-03-10
    • 2012-04-14
    相关资源
    最近更新 更多