【发布时间】:2018-03-27 22:05:59
【问题描述】:
我正在尝试使用 pyfpgrowth 库查找频繁模式,并且 pandas,首先我创建了一个包含一列的数据框,每一行都是一个事务,代码如下:
import pyfpgrowth
import pandas as pd
import numpy as np
data = pd.read_csv("itemsets1.csv")
data = pd.DataFrame(data)
data.columns = ['itemsets']
data
输出:
patterns = pyfpgrowth.find_frequent_patterns(data['itemsets'],6)
patterns
输出:
{(' ',): 6, (' ', '1'): 8, ('1',): 9, ('1', '8'): 6, ('8',): 6}
实际上我在这里有两个问题,第一个是算法将空间作为一个错误的项目,第二个是项目的频率,例如项目一个“1”只出现一次,但在输出中它显示9 也错了,求大神帮忙
【问题讨论】:
标签: python data-mining