提取HTML代码中文字的C#函数  /// 去除HTML标记
提取HTML代码中文字的C#函数  
/// </summary>
提取HTML代码中文字的C#函数  
/// <param name="strHtml">包括HTML的源码 </param>
提取HTML代码中文字的C#函数  
/// <returns>已经去除后的文字</returns>
提取HTML代码中文字的C#函数  public static string StripHTML(string strHtml)
{
{
提取HTML代码中文字的C#函数          
@"<script[^>]*?>.*?</script>",
提取HTML代码中文字的C#函数
提取HTML代码中文字的C#函数          
@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
提取HTML代码中文字的C#函数          
@"([\r\n])[\s]+",
提取HTML代码中文字的C#函数          
@"&(quot|#34);",
提取HTML代码中文字的C#函数          
@"&(amp|#38);",
提取HTML代码中文字的C#函数          
@"&(lt|#60);",
提取HTML代码中文字的C#函数          
@"&(gt|#62);"
提取HTML代码中文字的C#函数          
@"&(nbsp|#160);"
提取HTML代码中文字的C#函数          
@"&(iexcl|#161);",
提取HTML代码中文字的C#函数          
@"&(cent|#162);",
提取HTML代码中文字的C#函数          
@"&(pound|#163);",
提取HTML代码中文字的C#函数          
@"&(copy|#169);",
提取HTML代码中文字的C#函数          
@"&#(\d+);",
提取HTML代码中文字的C#函数          
@"-->",
提取HTML代码中文字的C#函数          
@"<!--.*\n"
提取HTML代码中文字的C#函数         
提取HTML代码中文字的C#函数         }
;
提取HTML代码中文字的C#函数
{
提取HTML代码中文字的C#函数           
"",
提取HTML代码中文字的C#函数           
"",
提取HTML代码中文字的C#函数           
"",
提取HTML代码中文字的C#函数           
"\"",
提取HTML代码中文字的C#函数
           "&",
提取HTML代码中文字的C#函数           
"<",
提取HTML代码中文字的C#函数           
">",
提取HTML代码中文字的C#函数           
" ",
提取HTML代码中文字的C#函数           
"\xa1",//chr(161),
提取HTML代码中文字的C#函数
           "\xa2",//chr(162),
提取HTML代码中文字的C#函数
           "\xa3",//chr(163),
提取HTML代码中文字的C#函数
           "\xa9",//chr(169),
提取HTML代码中文字的C#函数
           "",
提取HTML代码中文字的C#函数           
"\r\n",
提取HTML代码中文字的C#函数           
""
提取HTML代码中文字的C#函数          }
;
提取HTML代码中文字的C#函数
提取HTML代码中文字的C#函数   
string newReg =aryReg[0];
提取HTML代码中文字的C#函数   
string strOutput=strHtml;
提取HTML代码中文字的C#函数   
for(int i = 0;i<aryReg.Length;i++)
{
提取HTML代码中文字的C#函数    Regex regex 
= new Regex(aryReg[i],RegexOptions.IgnoreCase );
提取HTML代码中文字的C#函数    strOutput 
= regex.Replace(strOutput,aryRep[i]);
提取HTML代码中文字的C#函数   }

提取HTML代码中文字的C#函数
提取HTML代码中文字的C#函数   strOutput.Replace(
"<","");
提取HTML代码中文字的C#函数   strOutput.Replace(
">","");
提取HTML代码中文字的C#函数   strOutput.Replace(
"\r\n","");
提取HTML代码中文字的C#函数
提取HTML代码中文字的C#函数
提取HTML代码中文字的C#函数   
return strOutput;
提取HTML代码中文字的C#函数  }

相关文章: