【发布时间】:2021-09-26 15:59:33
【问题描述】:
我想提取 B0153R2A9I 从数据框中的一列中的网址。 例如'http://www.example.com/zs/B0153R2A9I'
我在 reddit 组中找到了这段代码 -
import re
search = re.search(r'B[A-Z0-9]{9}', url)
print(search.group(0))
虽然这似乎适用于一个链接,但当我尝试将其应用于这样的列时 -
import re
df['code'] = re.search(r'B[A-Z0-9]{9}', "", df['pro_link'])
df['pro_link'] 列包含所有链接。 df['code'] 是要创建的新列。
我收到此错误 TypeError: 'Series' 对象是可变的,因此它们不能被散列。
【问题讨论】:
标签: python regex pandas dataframe