using System.Text.RegularExpressions

///   <summary>   
ASP.NET 去除所有HTML标记的方法  
///    去除HTML标记   
ASP.NET 去除所有HTML标记的方法  
///   </summary>   
ASP.NET 去除所有HTML标记的方法  
///   <param    name="NoHTML">包括HTML的源码   </param>   
ASP.NET 去除所有HTML标记的方法  
///   <returns>已经去除后的文字</returns>   
ASP.NET 去除所有HTML标记的方法  public   static   string    NoHTML(string    Htmlstring)   
ASP.NET 去除所有HTML标记的方法  {   
ASP.NET 去除所有HTML标记的方法  //删除脚本   
ASP.NET 去除所有HTML标记的方法
   Htmlstring   =    Regex.Replace(Htmlstring,@"<script[^>]*?>.*?</script>","",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法  //删除HTML   
ASP.NET 去除所有HTML标记的方法
   Htmlstring   =    Regex.Replace(Htmlstring,@"<(.[^>]*)>","",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"([\r\n])[\s]+","",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"-->","",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"<!--.*","",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法    
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"&(quot|#34);","\"",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"&(amp|#38);","&",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"&(lt|#60);","<",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"&(gt|#62);",">",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"&(nbsp|#160);","   ",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"&(iexcl|#161);","\xa1",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"&(cent|#162);","\xa2",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"&(pound|#163);","\xa3",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,@"&(copy|#169);","\xa9",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法   Htmlstring   =    Regex.Replace(Htmlstring,   @"&#(\d+);","",RegexOptions.IgnoreCase);   
ASP.NET 去除所有HTML标记的方法    
ASP.NET 去除所有HTML标记的方法   Htmlstring.Replace("<","");   
ASP.NET 去除所有HTML标记的方法   Htmlstring.Replace(">","");   
ASP.NET 去除所有HTML标记的方法   Htmlstring.Replace("\r\n","");   
ASP.NET 去除所有HTML标记的方法   Htmlstring=HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();   
ASP.NET 去除所有HTML标记的方法    
ASP.NET 去除所有HTML标记的方法  return    Htmlstring;   
ASP.NET 去除所有HTML标记的方法   }

 

写一个静态方法   
ASP.NET 去除所有HTML标记的方法  #region    移除HTML标签   
ASP.NET 去除所有HTML标记的方法  ///   <summary>   
ASP.NET 去除所有HTML标记的方法  
///    移除HTML标签   
ASP.NET 去除所有HTML标记的方法  
///   </summary>   
ASP.NET 去除所有HTML标记的方法  
///   <param    name="HTMLStr">HTMLStr</param>   
ASP.NET 去除所有HTML标记的方法  public   static   string      ParseTags(string    HTMLStr)   
ASP.NET 去除所有HTML标记的方法  {   
ASP.NET 去除所有HTML标记的方法  return    System.Text.RegularExpressions.Regex.Replace(HTMLStr,   "<[^>]*>",   "");     
ASP.NET 去除所有HTML标记的方法   }   
ASP.NET 去除所有HTML标记的方法    
ASP.NET 去除所有HTML标记的方法  #endregion   
ASP.NET 去除所有HTML标记的方法    
ASP.NET 去除所有HTML标记的方法                  #region    取出文本中的图片地址   
ASP.NET 去除所有HTML标记的方法                  ///   <summary>   
ASP.NET 去除所有HTML标记的方法                  
///    取出文本中的图片地址   
ASP.NET 去除所有HTML标记的方法                  
///   </summary>   
ASP.NET 去除所有HTML标记的方法                  
///   <param    name="HTMLStr">HTMLStr</param>   
ASP.NET 去除所有HTML标记的方法                  public   static   string    GetImgUrl(string    HTMLStr)   
ASP.NET 去除所有HTML标记的方法                  {   
ASP.NET 去除所有HTML标记的方法                          string    str   =   string.Empty;   
ASP.NET 去除所有HTML标记的方法                          string    sPattern   =   @"^<img\s+[^>]*>";   
ASP.NET 去除所有HTML标记的方法                           Regex    r   =   new    Regex(@"<img\s+[^>]*\s*src\s*=\s*([']?)(?<url>\S+)'?[^>]*>",   
ASP.NET 去除所有HTML标记的方法                                   RegexOptions.Compiled);   
ASP.NET 去除所有HTML标记的方法                           Match    m   =    r.Match(HTMLStr.ToLower());   
ASP.NET 去除所有HTML标记的方法                          if    (m.Success)   
ASP.NET 去除所有HTML标记的方法                                   str   =    m.Result("${url}");   
ASP.NET 去除所有HTML标记的方法                          return    str;   
ASP.NET 去除所有HTML标记的方法                   }   
ASP.NET 去除所有HTML标记的方法    
ASP.NET 去除所有HTML标记的方法                  #endregion

相关文章: