近日做了一下采集某个网页的内容,并获取其中所有的链接地址及链接标题。

 其中用到了HttpWebRequest和正则表达式,代码备忘如下:
 

HttpWebRequest及正则表达式 //WebClient wc = new WebClient();
HttpWebRequest及正则表达式
//NetworkCredential nc = new NetworkCredential("用户名", "密码", "域名");
HttpWebRequest及正则表达式        
//wc.Credentials = nc;
HttpWebRequest及正则表达式        
//Response.Write(Server.HtmlEncode(wc.DownloadString("地址")));
HttpWebRequest及正则表达式

HttpWebRequest及正则表达式        HttpWebRequest req 
= (HttpWebRequest)WebRequest.Create("地址");
HttpWebRequest及正则表达式        req.Credentials 
= new NetworkCredential("用户名""密码""域名");
HttpWebRequest及正则表达式        req.Method 
= "GET";        
HttpWebRequest及正则表达式        IAsyncResult ir 
= req.BeginGetResponse(nullnull);
HttpWebRequest及正则表达式        ir.AsyncWaitHandle.WaitOne();
        }

 

这其中,正则表达式迷糊了我一会儿:因为没有使用惰性匹配,导致每一次都只能匹配到一条信息。。。。

 

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-11-22
  • 2022-12-23
  • 2021-10-19
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-12-13
  • 2021-12-13
相关资源
相似解决方案