【发布时间】:2016-06-29 18:39:43
【问题描述】:
我使用 Pandas 将 CSV 导入 Python,我希望能够将其中一个用作列作为事务 ID,以便我制定关联规则。
(链接:https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv)
我希望有人可以帮助我:
使用 UUID 作为事务 ID,让我拥有如下数据框:
UUID Desc
123ex Meat,Beer
为了让我获得如下关联规则:{Meat} => {Beer}。
此外,我们将不胜感激以一种简单的方式推荐图书馆。
感谢您的宝贵时间。
【问题讨论】:
-
对不起,你是在
df.loc[df['UUID'] == some_id', 'Desc']之后吗?或者类似df.groupby('UUID')['Desc'].apply(list)? -
第二个完美!但是,它返回给我的类型是 pandas.core.series.Series,有没有办法将其保留为数据框?如果它可以像任何数据框一样可编辑并作为一个导入,我猜你刚刚回答了我的问题。因此,您可以将其发布在答案中,我可以为您 +1 并将我的问题标记为已回答。 :) @EdChum
-
我也想过这样的事情:
pd.pivot_table(df_du,index=["UUID"], values=["Desc"])但它不起作用。 @EdChum -
不确定你对
Series的反感是什么,你可以像使用df一样使用它们,你也可以在groupby对象上调用reset_index -
我需要它成为数据框,以便我将其导出到 R。不过,
df.reset_index()工作得很好。你能对答案发表评论吗?
标签: python csv pandas dataframe arules