【发布时间】:2010-02-01 08:11:02
【问题描述】:
让this 线程更进一步,有人能告诉我这两个正则表达式有什么区别吗?他们似乎都完成了同样的事情:从 html 中提取链接。
表达式 1:
'/(https?://)?(www.)?([a-zA-Z0-9_%]*)\b.[a-z]{2,4}(.[a-z]{2})?((/[a-zA-Z0-9_%])+)?(.[a-z])?/'
表达式 2:
'/<a.*?href\s*=\s*["\']([^"\']+)[^>]*>.*?<\/a>/si'
哪个更好用?我如何修改其中一个表达式以仅匹配包含某些单词的链接,并忽略任何不包含这些单词的匹配项?
谢谢。
【问题讨论】: