【发布时间】:2017-10-24 13:27:46
【问题描述】:
我正在尝试将左连接应用于下面显示的两个数据框。
outlier day season
0 11556.0 0 1
==========================================
date bikeid date2
0 1 16736 2016-06-06
1 1 16218 2016-06-13
2 1 15254 2016-06-20
3 1 16327 2016-06-27
4 1 17745 2016-07-04
5 1 16975 2016-07-11
6 1 17705 2016-07-18
7 1 16792 2016-07-25
8 1 18540 2016-08-01
9 1 17212 2016-08-08
10 1 11556 2016-08-15
11 1 17694 2016-08-22
12 1 14936 2016-08-29
outliers = pd.merge(outliers, sum_Day, how = 'left', left_on = ['outlier'], right_on = ['bikeid'])
outliers = outliers.dropna(axis=1, how='any')
trip_outlier day season
0 11556.0 0 1
如上所示应用左连接后,我删除了所有 NaN 行,这给出了上面的结果。然而,期望的结果应该如下所示
trip_outlier day season date2
0 11556.0 0 1 2016-08-15
【问题讨论】: