【发布时间】:2018-04-06 20:14:23
【问题描述】:
我有一个dataframe,它有一列,每个值都是一个列表,现在我想派生一个新列,它只考虑大小大于 1 的列表,并将一个唯一整数分配给相应的行作为 id .
一个示例dataframe 就像,
document_no_list cluster_id
[1,2,3] 1
[4,5,6,7] 2
[8] nan
[9,10] 3
column cluster_id 只考虑第 1、2、4 行,每行的大小都大于 1,并为其在该列中的对应单元格分配一个唯一的整数 id。
我想知道如何在pandas 中做到这一点。
【问题讨论】:
-
如果你想使用正确的python
NaN,cluster_id的dtype不能是int。这里有一个link 以获得更多说明。
标签: python-3.x pandas dataframe