【发布时间】:2012-05-12 14:15:27
【问题描述】:
我正在为 WP7 和 Win7 开发一个应用程序,它将直接从特定网站中提取信息。该应用程序将下载 HTML 源代码并对其进行解析以找到所需的字符串。字符串可能没有标签。我尝试过传统的 TextBox.SelectionText 方法,但它需要很长时间才能可行。
有没有更快的方法在 HTML 源代码中寻找字符串?
【问题讨论】:
标签: html string parsing search full-text-search
我正在为 WP7 和 Win7 开发一个应用程序,它将直接从特定网站中提取信息。该应用程序将下载 HTML 源代码并对其进行解析以找到所需的字符串。字符串可能没有标签。我尝试过传统的 TextBox.SelectionText 方法,但它需要很长时间才能可行。
有没有更快的方法在 HTML 源代码中寻找字符串?
【问题讨论】:
标签: html string parsing search full-text-search
“String.IndexOf”方法应该是确定字符串是否位于页面 HTML 中的最有效方法。
因此,如果你有来自各个网站的HTML文件,你可以将页面一个一个地加载到一个字符串中,并使用“IndexOf”来识别页面中是否存在某个字符串。
【讨论】: