【发布时间】:2018-09-18 12:28:45
【问题描述】:
我正在尝试合并两个数据框,一个包含赛马获胜几率的详细信息,另一个包含位置几率的详细信息。它们共享一些相同的列名。我目前在马的名字上得到重复,我不认识的几率。我认为问题正在发生,因为有些比赛没有地方市场,只有获胜市场,所以事情很混乱。下面是左边的获胜表的例子,放在右边。
Time Horse Odds Result Time Horse Odds_P Result_P
13:55 Go faster 5.0 1 13:55 Go faster 5.0 1
14:10 Slow down 4.0 0
我希望能够将 Odds_P 和 Result_P 添加到获胜数据帧的末尾以更快地进行,并删除没有相应地方市场的条目。
我尝试过 concat、join 和 merge,所有这些都向我展示了一些重复的马名,而且几率我不认识。
任何帮助将不胜感激
【问题讨论】:
-
我仍然无法理解你在说什么。您能否添加您的预期输出?还有,你可能尝试过的代码?
-
嗨,伙计,当然。所以我的预期输出是:Time Horse Odds Result Odds_P Result_P 13:55 Go faster 5.0 1 5.0 1
-
嗯,我似乎无法为您提供一个好的格式,但我基本上希望odds_p 和 result_p 加入获胜数据帧的末尾(左侧的那个)并丢弃14:10 的比赛来自 win 数据框,因为它没有对应的地方市场
-
我尝试过:total_data = df_win.merge(df_place, on='SELECTION_NAME', how='outer') 和许多其他变体,但我得到了一些奇怪的结果。这让我最接近我想要的,但我仍然让马出现在不同的比赛中,那不应该在那里,就像它在将数据连接在一起的过程中出现了一个小故障。我知道数据框都是正确的,因为我已经通过并在 excel 中加入了它们
标签: python pandas dataframe merge