【发布时间】:2011-11-09 10:18:36
【问题描述】:
当通过CURL 或file_get_contents 捕获网页内容时,删除内联 javascrip 代码的最简单方法是什么。我正在考虑使用正则表达式来删除标签之间的所有内容;但正则表达式不是用于此目的的可靠方法。
是否有更好的方法来解析 html 页面(仅删除 javascript 代码)?如果 regex 仍然是最佳选择,那么最可靠的命令是什么?
【问题讨论】:
标签: php html regex parsing html-parsing