【发布时间】:2009-10-30 08:53:25
【问题描述】:
我一直在玩 HPricot,但经过大量搜索后,我无法解决这个问题。
我正在尝试解析 HTML 页面并找到所有带有 href 的标签到 mp3 文件。到目前为止,我已经得到了
<ul>
<% @page.search('//a[@href*=mp3]').each do |link| %>
<li>
<%= link.inner_text %>
</li>
<% end %>
</ul>
工作正常,还有一个正则表达式 /href\s*=\s*\"([^\"]+)(.mp3)/ 也可以工作。我只是不确定如何将两者结合起来。
是否有一个很好的例子,或者有人可以指出我的文档,以便弄清楚我可以用 .search 函数做什么。
谢谢
【问题讨论】:
-
我已经能够使用 ,但我仍然不确定如何隔离该链接中的 href。