【发布时间】:2017-10-14 11:33:25
【问题描述】:
我在搜索组合频率的正确解时遇到了问题。
这是我的代码:
import pandas as pd
import itertools
list = [1,20,1,50]
combinations = []
for i in itertools.combinations(list ,2):
combinations .append(i)
data = pd.DataFrame({'products':combinations})
data['frequency'] = data.groupby('products')['products'].transform('count')
print data
The out is:
products frequency
0 (1, 20) 1
1 (1, 1) 1
2 (1, 50) 2
3 (20, 1) 1
4 (20, 50) 1
5 (1, 50) 2
问题是(1, 20)和(20, 1),频率放1但是是相同的组合,必须是2,有没有什么方法可以正确解?
【问题讨论】:
标签: python dataframe count frequency apriori