src: http://www.cnblogs.com/NoblePaul/archive/2004/09/25/46532.aspx
在抓取html页时,需要过滤掉html代码,获取Html源代码中的Text,有正则表达式可以解决这个问题:
VB.NET
将Html代码转换为Text    ''' -----------------------------------------------------------------------------
将Html代码转换为Text
    ''' <summary>
将Html代码转换为Text
    ''' 移除所有的html标签
将Html代码转换为Text
    ''' </summary>
将Html代码转换为Text
    ''' <param name="HTML">html代码</param>
将Html代码转换为Text
    ''' <returns></returns>
将Html代码转换为Text
    ''' <remarks>
将Html代码转换为Text
    ''' </remarks>
将Html代码转换为Text
    ''' <history>
将Html代码转换为Text
    '''     [Administrator]    2004-9-25    Created
将Html代码转换为Text
    ''' </history>
将Html代码转换为Text
    ''' -----------------------------------------------------------------------------
End Function

C#
        }
提供一简单示例如下:
VB.NET
End Sub

C#
将Html代码转换为Text        private void Page_Load(object sender, System.EventArgs e)
        }

相关文章: