【发布时间】:2012-08-17 21:14:12
【问题描述】:
我正在使用 cURL 来提取远程站点的内容。我需要检查所有“href=”属性并确定它们是相对路径还是绝对路径,然后获取链接的值并将其路径到类似 href="http://www.website.com/index.php ?url=[ABSOLUTE_PATH]"
任何帮助将不胜感激。
【问题讨论】:
-
我最近做了一些与此非常相似的事情:stackoverflow.com/questions/11759028/… - 这不是你想要的,但希望它能给你一个大致的想法/一个起点
-
我不确定,但不是所有绝对 URL 都以协议开头,在几乎所有情况下都是“http://”?所以我想你可以检查 URL 是否以那个开头。
-
@DaveRandom - 它似乎正在工作,唯一的问题似乎是 html5 标签的问题,如“header”、“footer”、“nav”等......有什么想法吗?
-
@Fluidbyte 您能否展示一些您正在尝试处理的示例 HTML 源代码?