【发布时间】:2018-08-07 20:22:07
【问题描述】:
我有两个包含数千行的数据框,我需要将它们组合成一个数据框,而不会重复和反转。例如:
数据框 1
drug1
drug2
drug3
数据框 2
disease1
disease2
disease3
因此,输出数据帧将是:
输出数据帧
drug1 disease1
drug1 disease2
drug1 disease3
drug2 disease1
drug2 disease2
drug2 disease3
drug3 disease1
drug3 disease2
drug3 disease3
我不想要包含以下内容的输出组合:
disease1 drug1
drug1 drug1
disease1 disease1
我实际上使用pd.merge 尝试它,但它返回重复和还原,并且还需要很长时间,因为我在 Dataframes 1 和 2 中有数千个
有什么帮助吗?
【问题讨论】:
-
这是Cartesian product,我确定在
itertools中可用 -
不,没关系,我想要 drug2 disease2 和 drug3 disease3 @ScottBoston
-
我认为@ScottBoston 的意思是您的“不想要的”输出中有
drug1 disease1。 -
哦对不起我混了,我的意思是如果我有一个组合我不想要相反的@ScottBoston
标签: python pandas dataframe combinations