【发布时间】:2017-06-05 22:15:58
【问题描述】:
我有以下链接要提取:
[{"file":"https:\/\/www.rapidvideo.com\/loadthumb.php?v=FFIMB47EWD","kind":"thumbnails"}],
"sources": [
{"file":"https:\/\/www588.playercdn.net\/85\/1\/e_q8OBtv52BRyClYa_w0kw\/1496784287\/170512\/359E33j28Jo0ovY.mp4",
"label":"Standard (288p)","res":"288"},
{"file":"https:\/\/www726.playercdn.net\/86\/1\/q64Rsb8lG_CnxQAX6EZ2Sw\/1496784287\/170512\/371lbWrqzST1OOf.mp4"
我想提取以mp4结尾的链接
我的正则表达式如下:
"file":"(https\:.*?\.mp4)"
但是,我的匹配是错误的,因为第一个以 php 结尾的链接是匹配的。 我在这里练习Pythex.org。如何避免第一个链接? 我要解析的html页面的链接是https://www.rapidvideo.com/e/FFIMB47EWD
【问题讨论】:
标签: python regex non-greedy