【发布时间】:2017-10-09 19:23:50
【问题描述】:
我想抓取网站的 HTML。当我用我的浏览器(无论是Chrome还是FireFox)访问这个网站时,我访问网站+HTML都没有问题。
当我尝试使用 HttpWebRequest 和 HtmlAgilityPack 等方法使用 C# 解析 HTML 时,网站会将我重定向到另一个网站,因此我会解析重定向网站的 HTML。
知道如何解决这个问题吗?
我认为该网站将我的程序识别为程序并立即重定向,因此我尝试使用 Selenium 以及 GoogleDriver 和 FireFoxDriver 但也没有运气,我立即被重定向。
网站:https://www.jodel.city/7700#!home
private void bt_load_Click(object sender, EventArgs e)
{
var url = @"https://www.jodel.city/7700#!home";
var req = (HttpWebRequest)WebRequest.Create(url);
req.AllowAutoRedirect = false;
// req.Referer = "http://www.muenchen.de/";
var resp = req.GetResponse();
StreamReader sr = new StreamReader(resp.GetResponseStream());
String returnedContent = sr.ReadToEnd();
Console.WriteLine(returnedContent);
return;
}
【问题讨论】:
-
那么,如果你们没有人可以访问它,那背后是什么?只有德国 IP 还是什么?
标签: c# html redirect httpwebrequest html-agility-pack