【发布时间】:2019-07-01 11:08:28
【问题描述】:
我有一个简单的数据集,已作为数据框存储在 pandas 中。我尝试每行测量唯一条目的数量,如果出现则忽略 -1 数字。
...
我正在添加此列
pdSequences['unique']=pdSequences.apply(pd.Series.nunique, axis=1)
但正如您所见,代码并非总是能正常工作。第一行正确返回唯一值是四(忽略最后两个 -1)。
如果您看到第 28 行,我想返回 5,但代码返回 6。
您能帮我理解为什么会出现这两种不同类型的行为以及如何计算唯一条目(但忽略 -1)吗?
谢谢 亚历克斯
【问题讨论】:
-
请提供文本格式的数据,而不是图片。我们不想手动输入您的所有数据。谢谢 !能否提供预期的输出?
-
行为正确,第一行有4个唯一数字(58、68、59、-1)
-
如果要忽略
-1,则第1行的唯一值数量为3:58, 68, 59。如果您提供一些示例数据(不在图片中),我们可以重现答案