【发布时间】:2008-12-12 13:08:12
【问题描述】:
我正在尝试计算 ASP.NET 自动命名服务器控件的开销。我有一个页面,其中包含从数百个嵌套的 ASP.NET 控件呈现的 7,000 行 HTML,其中许多具有长度为数百个字符的 id/name 属性。
理想情况下,我希望将每个以“ctl00”开头的 HTML 属性值提取到一个列表中。如果我知道正则表达式应该是什么,Notepad++ 中的正则表达式查找功能将是完美的?
例如,如果 HTML 是:
我希望输出类似于:
name="ctl00$Header$Search$Keywords"
更高级的搜索可能还包括元素名称(例如控件类型):
input|name="ctl00$Header$Search$Keywords"
为了同时处理 Id 和 Name 属性,我将简单地重新运行搜索以查找 Id 而不是 Name(即,我不需要同时搜索两者的东西)。
最终输出将是一个 Excel 报告,其中列出了页面上服务器控件的数量,以及每个名称的长度,可能按控件类型排序。
【问题讨论】:
标签: asp.net html regex html-content-extraction