【发布时间】:2014-03-19 19:38:36
【问题描述】:
imo 标题有点不清楚,但我找不到更好的方式来表达我的担忧。 我正在尝试从 Reddit 获取一些图片。所以当我试图获取图片的网址时 我遇到了一些问题。
$url = 'http://www.reddit.com/r/pics';
$str = file_get_contents($url);
这是我目前拥有的。要获取 url 代码中 image-url 所在的特定部分,我需要找到 html 的这一部分:
`<a class="thumbnail may-blank " href="http://i.imgur.com/K4q9i5c.jpg">`
当我试图弄清楚如何获取页面上所有链接的每个 href 时,我只能考虑正则表达式。 寻找部分
<a class="thumbnail may-blank "
然后找到这个>标志我可以得到整行。我最终可以从哪里获得图片的网址。
所以我一直在尝试并试图找到一个匹配的正则表达式,但我无法让它工作。也许这里有人可以帮助我。或者有更好的解决方案。
非常感谢, 谢谢
【问题讨论】:
-
还有更简单的选项,例如带有
qp($url)->find("a.thumbnail.may-blank").attr("href");的QueryPath(和一个循环)。正则表达式只有在输入一致的情况下才可取和/或,前提是您精通它。 -
感谢马里奥关于 QueryPath 的提示。我现在有点迷路了,因为我正试图在我的 Windows 电脑上安装这个东西。如果我是对的,安装程序似乎适用于 Linux。
标签: php regex file-get-contents