【发布时间】:2012-06-05 08:17:35
【问题描述】:
什么更快?我刚刚制作了一个使用 HTML Agility 包的网络爬虫,它消耗了大量内存。
使用内存分析器对其进行分析,我发现 HTMLDocument、HTMLNode 等实例占用了最多的内存。
我觉得使用正则表达式可能会更快更高效,我错了吗?
【问题讨论】:
-
根据经验,你导入的越少,程序越快;你导入的越多,程序员的速度就越快。当然,正则表达式更便宜(除非他们在幕后使用正则表达式。)
-
在 SO 上看到那个著名的问题:stackoverflow.com/questions/1732348/… 它应该会阻止您使用正则表达式来解析 HTML。
标签: c# regex memory html-agility-pack