【问题标题】:spliting urls and geting new ones拆分网址并获取新网址
【发布时间】:2019-07-24 09:54:57
【问题描述】:

我有很多这样的网址:

https://www.example1.com/var1/var2/var3/
https://www.example2.com/var1/var2/var3/var4
https://www.example4.com/var1/

如果路径部分中有两个以上的元素,我希望能够仅提取路径的前两个元素。

像这样:

https://www.example1.com/var1/var2/
https://www.example2.com/var1/var2/
https://www.example4.com/var1/

我正在使用 python,我知道我应该使用 Regex,但是我尝试过的代码并没有给我想要的。

【问题讨论】:

  • 请将您在问题中尝试过的代码也发布出来,以便我们看到您出错的地方。

标签: python regex url


【解决方案1】:

或者使用带有split 的列表推导并获得前五个拆分:

print(['/'.join(i.split('/')[:5]) for i in l])]

输出:

['https://www.example1.com/var1/var2', 'https://www.example2.com/var1/var2', 'https://www.example4.com/var1/']

【讨论】:

    【解决方案2】:

    您可以将str.split("/", 5)str.join 一起使用

    例如:

    s =  ['https://www.example1.com/var1/var2/var3/', 'https://www.example2.com/var1/var2/var3/var4', 'https://www.example4.com/var1/']
    
    for i in s:
        print( "/".join(i.split("/", 5)[:-1]) )
    

    输出:

    https://www.example1.com/var1/var2
    https://www.example2.com/var1/var2
    https://www.example4.com/var1
    

    【讨论】:

      猜你喜欢
      • 2016-12-06
      • 2019-08-18
      • 2016-11-28
      • 2017-11-01
      • 1970-01-01
      • 2010-10-28
      • 2011-01-26
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多