【发布时间】:2020-08-21 14:37:31
【问题描述】:
我正在通过网络进行网络分析,并注意到一些节点被区别对待只是因为它们有额外的空格(前导)。
我尝试使用以下代码删除空格,但似乎无法使输出再次变为字符串。
rhedge = pd.read_csv(r"final.edge.csv")
rhedge
_________________
source | to
niala | Sana, Sana
Wacko | Ana, Aisa
rhedge['to'][1]
'Sana, Sana'
rhedge['splitted_users2'] = rhedge['to'].apply(lambda x:x.split(','))
#I need to split them so they will be included as different nodes
问题出在下一个代码
rhedge['splitted_users2'][1]
['Sana', ' Sana']
如您所见,第二个 Sana 有一个前导空格。
我尝试过这样做:
split_users = []
for i in split:
row = [x.strip() for x in i]
split_users.append(row)
pd.Series(split_users)
但是当我再次尝试用“,”分割它们时,它不会允许我,因为数据集现在是列表。我相信拆分它们会使网络将它们视为一个节点,而不是为具有前导空格的一个节点创建一个不同的节点。
谢谢你
【问题讨论】:
标签: string pandas list dataframe split