【发布时间】:2015-11-14 03:55:02
【问题描述】:
这是一个简单的文本文件。
网址:
- 可以有 https:// 或 http://
- 消除和尾随 url/ 文件路径
- 仅提取域和/或子域
我有 Notepad++ 和 EditPlus
愿意接受其他建议吗?
例子:
http://ayurfit.ning.com/main/authorization/signIn
http://bangalore.olx.in/login.php
http://birthdayshoes.com/forum/index.php
尝试:
/(?!.{253})((?!-)[A-Za-z0-9-]{1,63}(?<!-)\.){1,126}+[A-Za-z]{2,6}/
^(?:https?://)?([^/.]+(?=\.)|)(\.?[^/.]+\.[^/]+)/?(.+|)$
https://regex101.com/r/hZ4cL4/4
在其他机器上尝试了很多作为 Regex101 的示例
也发现了这个小金块。一旦我理解它,我会发布它的不同之处。
【问题讨论】:
-
请发表您的尝试。
-
会这样做。它在另一台机器上。耽误。复制粘贴我的尝试。
-
/(?!.{253})((?!-)[A-Za-z0-9-]{1,63}(?
-
你试过了吗,比如说
\b[\w-]+(?:\.[\w-]+)+\b?
标签: regex url notepad++ subdomain