【发布时间】:2019-01-04 09:32:33
【问题描述】:
我使用 BBEdit。 BBEdit 支持多文件搜索和 GREP 替换。使用这个(从 stackoverflow 的 Notepad++ 帖子复制):
(\bhref="|(?!^)\G)[^"<_]*\K_
我可以获得包含下划线的所有 URL 的列表。这个想法是用破折号替换所有下划线。没问题,BBEdit 搜索面板有一个“替换为”字段(如 Notepad++)。
一切都很好,但是我实际上不想处理所有 URL。例如,文件下载 URL 应保持原样,尤其是扩展名为 .exe、.zip、.sit 和 .dmg 的 URL。实际上我要处理的网址是 .php 和 .html 网址。
我的意思是应该在这里找到这种类型的 URL:
<a href="software/internet-tools/ftp-disk_sheet_us.php">
但不是这个:
<a href="software/internet-tools/ftp-disk_us_setup.exe">
到目前为止,我尝试编辑上面的 REGEX 未成功,因为我必须处理 600 个文件中的大约 30,000 个 url,我真的很想确保我没有做错任何事情。
非常感谢您提前帮我解决这个问题。
【问题讨论】:
-
请edit您的帖子并向我们显示您想要处理/匹配的网址以及您想要保持相同的文本。
标签: regex grep notepad++ bbedit