【发布时间】:2014-11-18 06:49:18
【问题描述】:
我想创建一个 SplitName() 函数,它 1) 将所有字母转换为小写,2) 按空格拆分名称条目(即“John Snow”为“John”和“Snow”)和 3)在 Pandas 中创建一个数据框,该数据框采用拆分名称实体并创建新列(一个作为“名字”,另一个作为“姓氏”)。
我能够从数据框中创建新的系列变量并将名称实体操作为小写并按空格分割。但我不知道如何创建一个包含原始数据框信息以及新的“小写”和“拆分”变量信息的整体数据框
def SplitName():
data = pd.read_csv("C:\data.csv")
frame2 = DataFrame(data)
frame2.columns = ["Name", "Ethnicity", "Event_Place", "Birth_Place"]
name_lower = frame2["Name"].str.lower() # make names lower case
name_split = name_lower.str.split() # split string element by space
name_split_smallList = name_split[0:10] # small set to easily handle
#print name_split_smallList
'''for lastName in name_split_smallList:
print lastName[0] + " " + lastName[-1]'''
name_lower_list = name_lower.tolist()
frame_all = frame2 + name_lower_list
print frame_all[0:10]
【问题讨论】:
标签: python-2.7 pandas data-manipulation