【发布时间】:2020-02-07 16:02:39
【问题描述】:
我有一个数据框,其中每一行代表一个全名和一个网站。我需要将其拆分为 2 列:名称和网站。
我尝试使用 pandas str.split,但我正在努力创建一个正则表达式模式,该模式可以捕获任何初始的“http”以及网站的其余部分。我有以 http 和 https 开头的网站。
df = pd.DataFrame([['John Smith http://website.com'],['Alan Delon https://alandelon.com']])
我想要一个能够正确识别网站的模式来拆分我的数据。任何帮助将不胜感激。
【问题讨论】: