【发布时间】:2021-09-15 10:39:11
【问题描述】:
我有一个包含网页网址的数据集。 我有这样的事情:
我正在尝试用最后一个“/”之后的内容替换所有网址,所以我只是在使用
df["url"].str.split("/").str[-1]
但我希望将具有由字母和数字组成的长字符串(如第三个链接)的网址替换为“有效”,以及在最后一个“/”之后没有任何内容的网址被“home_page”取代,我该如何实现?
我想要这样的东西:
- 登录
- 主页
- 有效
【问题讨论】:
我有一个包含网页网址的数据集。 我有这样的事情:
我正在尝试用最后一个“/”之后的内容替换所有网址,所以我只是在使用
df["url"].str.split("/").str[-1]
但我希望将具有由字母和数字组成的长字符串(如第三个链接)的网址替换为“有效”,以及在最后一个“/”之后没有任何内容的网址被“home_page”取代,我该如何实现?
我想要这样的东西:
【问题讨论】:
你可以用 this。然后就可以更换了。
【讨论】:
请找到实现上述要求的代码:
urls = ["https://abc.eu/login", "https://abc.eu/", "https://abc.eu/ar35gjdb4"]
for url in urls:
s = url.rsplit('/', 1)
if s[1] == 'login':
print(os.path.join(s[0], 'login'))
elif s[1] == '':
print(os.path.join(s[0], 'home_page'))
elif re.match('^[a-zA-Z0-9_]+$', s[1]):
print(os.path.join(s[0], 'valid'))
【讨论】: