【发布时间】:2022-01-13 03:06:48
【问题描述】:
如何通过与包含国家名称的字符串列表进行比较,从数据框列中获取国家名称?
例如:
list = ["pakistan","united kingdom","uk","usa","united states","uae"]
# create dataframe column name is job_location of employee
df = pd.DataFrame({
'job_location' : ['birmingham, england, united kingdom','new jersey, united states','gilgit-baltistan, pakistan','uae','united states','pakistan','31-c2, gulberg 3, lahore, pakistan'],
})
df
job_location
0 birmingham, england, united kingdom
1 new jersey, united states
2 gilgit-baltistan, pakistan
3 uae
4 united states
5 pakistan
6 31-c2, gulberg 3, lahore, pakistan
我需要在数据框名称中添加一个新列作为国家/地区,其中包含来自 job_location 列的国家/地区名称。
【问题讨论】:
-
1.不要命名列表
list,这与 python 内置冲突。 2. 预期输出是多少? -
df 中的 new_column 仅包含 job_loction 列中的国家名称。 like job_location 0 英国 1 美国 2 巴基斯坦 3 阿联酋 4 美国 5 巴基斯坦 6 巴基斯坦
标签: python pandas dataframe substring