【发布时间】:2021-07-19 15:30:40
【问题描述】:
我有以下带有 10 行和 4 列的 pandas 数据框 df,其中包含 3 个分类变量:
df = pd.DataFrame(np.random.choice(["dog", "cat", "mice"], size=(10, 4)))
我想知道行之间所有可能的排列,并创建一个新的数据框,其中包含行组合的不同分组,例如在同一行中包含两次相同变量的组,如 cat cat dog mice 或 4 个相同的 pig pig pig pig 等。我尝试过使用Itertools,但没有成功。有人可以帮助一些迹象吗?谢谢
【问题讨论】:
-
如果你有预期的输出会更容易回答。
-
输出将是一个包含多行和 2 列的表:第一列将包含可以包含相同行或对或唯一组合的不同组,第二列将包含看到的组的计数 (频率)
标签: python pandas pandas-groupby itertools