【发布时间】:2019-04-08 21:11:42
【问题描述】:
如何使用正则表达式获取文档中的特定链接?
我有一个 html 文件,其中包含混合了一堆 html 代码和其他东西的谷歌驱动器链接。我试图从文本中获取 50 个链接,方法是使用 RegEx 搜索它们的共同关键字 drive, google, & sharing
例如:"https://drive.google.com/file/d/1wXbzf0nvddZ0vlz6-fdN7HV/view?usp=sharing"
我想选择链接的开头和结尾,然后将它们全部复制、粘贴到另一个文件或删除其他内容并将这些链接保留在 html 文档中。
我试过了
http\:\/\/www\.[a-zA-Z0-9\.\/\-]+ & `.*?(http\:\/\/www\.[a-zA-Z0-9\.\/\-]+)`
我尝试了驱动器,结果除了 http 和 www 之外什么都没有找到,结果显示到文件中的其他链接,我不想点击,但至少显示了一些结果,而不是我去寻找我列出的特定关键字。
我不确定这是否是解决此问题的正确方法以及是否应该使用其他方法(例如 javascript)来实现此等。
我在 Mac 上使用 Sublime Text 来尝试解决这个问题。我是正则表达式的新手。
【问题讨论】:
标签: html regex perl sublimetext3 jdownloader