【发布时间】:2018-01-31 08:38:39
【问题描述】:
我目前使用以下函数来检查包含二进制数据的列中的数据分布(例如https://pastebin.com/QpWfREYB)。
print(pd.value_counts(df['binary']).apply(lambda x: x/len(data['label'])*100))
print(pd.value_counts(df['binary']).apply(lambda x: x))
输出:
A 65.466667
B 34.533333
Name: label, dtype: float64
A 7856
B 4144
Name: label, dtype: int64
有没有一种简单的方法来获得如下输出:
A 7856 (65.67%)
B 4144 (65.67%)
Sum 12000 (100.00%)
?
【问题讨论】:
-
你能添加一些数据样本吗?