【发布时间】:2019-06-01 11:39:05
【问题描述】:
我想从一个列表中创建一个包含 2 列的数据框。 该列表包含:按顺序排列的州和地区名称 州是名称前面带有“编辑”的国家,其他词是地区名称 例如这里的州是阿拉巴马州,她的地区名称是奥本、佛罗伦萨……直到我们到达第二个州,即“阿拉斯加”。
['Alabama[edit]',
'Auburn',
'Florence',
'Jacksonville',
'Livingston',
'Montevallo',
'Troy',
'Tuscaloosa',
'Tuskegee',
'Alaska[edit]',
'Fairbanks',
'Arizona[edit]',
'Flagstaff',
'Tempe',
'Tucson',
'Arkansas[edit]',
'Arkadelphia',
....
数据框列将是州和地区名称。
这是我的代码:
for i in range(len(list)):
if 'edit' in list[i]:
university['state'][i:]=re.sub('\[.+','',list[i])
else:
university['regionName'][i]=list[i]
【问题讨论】:
-
请添加列表是什么样的,一个小样本,以及预期的输出是什么,也有一个例子。如果您有一些代码,请添加它。
-
酷。去做吧。什么阻碍了你?
-
欢迎来到 Stack Overflow!请参阅How to Ask 和The perfect question。花点时间阅读帮助中心的editing help。 Stack Overflow 上的格式设置与其他站点不同。您的帖子看起来越好,其他人就越容易阅读和理解。
-
亲爱的丹尼尔,我已经按照你的要求调整了输出。
标签: python pandas data-science