【问题标题】:Garbage text in GetResponseStream()GetResponseStream() 中的垃圾文本
【发布时间】:2014-06-16 21:41:16
【问题描述】:

我不断收到这样的垃圾文本

�\b\0\0\0\0\0\0�\a`I�%&/m�{J�J��t�\b�`$ؐ@������iG#

在我的 html 这个函数末尾的变量中。如您所见,通过注释掉的代码,我尝试了两种插入 Cookie 的方法。

我对这样的 HTTPwebRequest / Response 方法很陌生。但是从我在网上可以找到的所有内容来看,我正在正确设置我的方法。如果可能的话,我希望能得到一些帮助。

另外,当使用 Fiddler 解码我的请求时,并不是所有的 cookie 都会被发送。当我的代码运行时,我只发送 1 个 utma、1 个 utmb、1 个 utmc 和 1 个 utmz。但是,当我正常登录网站时,我会收到 2 个 utma、1 个 utmb、2 个 utmc 和 2 个 utmz。

我觉得这是我连接问题的根源,但我不确定。

static void FillCookieJar()
{
    Console.WriteLine("Filling cookie jar...\r\n");
    try
    {
        string parameters = "SUPER LONG POST DATA found from TEXTVIEW in Fidler";
        Uri target = new Uri("https://foo.bar.com/UserSignIn");

        byte[] buffer = Encoding.ASCII.GetBytes(parameters);

        HttpWebRequest request = (HttpWebRequest)WebRequest.Create(target);

        //Cookie chipOne = new Cookie("__utma", "XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XX") { Domain = target.Host };
        //Cookie chipTwo = new Cookie("__utma", "XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.X") { Domain = target.Host };
        //Cookie chipThree = new Cookie("__utmb", "XXXXXXXXX.X.XX.XXXXXXXXX") { Domain = target.Host };
        //Cookie chipFour = new Cookie("__utmc", "XXXXXXXXX") { Domain = target.Host };
        //Cookie chipFive = new Cookie("__utmc", "XXXXXXXXX") { Domain = target.Host };
        //Cookie chipSix = new Cookie("__utmz", "XXXXXXXXX.XXXXXXXXX.X.X.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=(not%20provided)") { Domain = target.Host };
        //Cookie chipSeven = new Cookie("__utmz", "XXXXXXXXX.XXXXXXXXX.XX.X.utmcsr=titlesource.com|utmccn=(referral)|utmcmd=referral|utmcct=/") { Domain = target.Host };

        //cookieJar.Add(chipOne);
        //cookieJar.Add(chipTwo);
        //cookieJar.Add(chipThree);
        //cookieJar.Add(chipFour);
        //cookieJar.Add(chipFive);
        //cookieJar.Add(chipSix);
        //cookieJar.Add(chipSeven);

        request.Headers.Add("__utma", "XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XX");
        request.Headers.Add("__utma", "XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.XXXXXXXXX.X");
        request.Headers.Add("__utmb", "XXXXXXXXX.X.XX.XXXXXXXXX");
        request.Headers.Add("__utmc", "XXXXXXXXX");
        request.Headers.Add("__utmc", "XXXXXXXXX");
        request.Headers.Add("__utmz", "XXXXXXXXX.XXXXXXXXX.X.X.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=(not%20provided)");
        request.Headers.Add("__utmz", "XXXXXXXXX.XXXXXXXXX.XX.X.utmcsr=titlesource.com|utmccn=(referral)|utmcmd=referral|utmcct=/");

        request.CookieContainer = cookieJar;
        request.Method = WebRequestMethods.Http.Post;
        request.KeepAlive = true;
        request.Accept = "*/*";
        request.Headers.Add("Cache-Control", "no-cache");
        request.Headers.Add("Accept-Encoding: gzip,deflate,sdch");
        request.Headers.Add("Accept-Language: en-US,en;q=0.8");
        request.UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.114 Safari/537.36";
        request.Headers.Add("X-Requested-With: XMLHttpRequest");
        request.ContentType = "application/x-www-form-urlencoded; charset=UTF-8";
        request.Referer = "https://foo.bar.com/UserSignIn";
        request.Headers.Add("Origin", "https://foo.bar.com");
        request.Headers.Add("X-MicrosoftAjax", "Delta=true");
        request.ContentLength = buffer.Length;

        Stream PostData = request.GetRequestStream();
        PostData.Write(buffer, 0, buffer.Length);
        PostData.Close();

        HttpWebResponse response = (HttpWebResponse)request.GetResponse();

        Stream Answer = response.GetResponseStream();
        StreamReader _Answer = new StreamReader(Answer);
        String html = _Answer.ReadToEnd();
        response.Close();

    }
    catch (Exception ex)
    {
        Console.WriteLine("Error FillingCookieJar");
    }
}

【问题讨论】:

  • @redFIVE 你将如何调试它? OP 已经用过 Fiddler。
  • 您确定编码是ASCII 而不是UTF-8?另外,你确定数据不是gzipped吗?对于后者,您可以在 HttpWebRequest 实例化之后使用 request.AutomaticDecompression = DecompressionMethods.Deflate | DecompressionMethods.GZip; 让类自动压缩 gzip。
  • 你发现了这两个问题!谢谢!但是,现在我的 html 变量又回来了 = 1|#||4|45|pageRedirect||https%3a%2f%2ffoo.bar.com%2fVendor|

标签: c# login httpwebrequest fiddler


【解决方案1】:

您需要解压缩 gzip 压缩的流以获取纯文本,这可能是 UTF-8 而不是 ASCII(在响应的 Content-Type 标头上查找 charset 属性)。

您可以使用AutomaticDecompression属性自动解压内容。

HttpWebRequest request = (HttpWebRequest)WebRequest.Create(target);
request.AutomaticDecompression = DecompressionMethods.Deflate | DecompressionMethods.GZip; 

您看到的网址是UrlEncoded。您可以使用HttpUtility.UrlDecode 使URL 看起来像https://foo.bar.com/Vendor

string decoded = HttpUtility.UrlDecode(html);

【讨论】:

  • 我可以用1|#||4|45|pageRedirect||https://foo.bar.com/Vendor| 做什么?我应该在下一个 HttpWebRequest 方法中使用它作为目标 URI 吗?
  • 这取决于你。您从站点返回的数据将根据站点而变化,但上面的信息显示了如何解码流。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2017-10-13
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多