【发布时间】:2011-11-07 09:40:03
【问题描述】:
如何在 Python 中提取 URL 中最后一个斜杠后面的内容?例如,这些 URL 应返回以下内容:
URL: http://www.test.com/TEST1
returns: TEST1
URL: http://www.test.com/page/TEST2
returns: TEST2
URL: http://www.test.com/page/page/12345
returns: 12345
我尝试了 urlparse,但它给了我完整的路径文件名,例如 page/page/12345。
【问题讨论】:
-
如果 URL 可能包含像
...?foo=bar这样的查询字符串,而您不希望这样;我建议将urlparse与 naeg 的basename-suggestion 结合使用。 -
网址可以以斜杠结尾。如果您需要
http://www.test.com/TEST1/来返回TEST1,那么所有这些答案都不适合您。 -
我有点失望,没有人在他们的例子中使用这个问题的 url :~(
-
@Boris:不再是 - 因为你的回答(现在也是我的)。 ;-)