【发布时间】:2018-05-14 08:10:41
【问题描述】:
我创建了一个要在 pandas 数据框中使用的掩码:
mask = np.logical_and(
csv_df['time'].map(operator.attrgetter('hour')).isin(
hours_set),
csv_df['time'].map(lambda x: x.weekday_name[:3]).isin(
days_set))
csv_df = csv_df.loc[mask, :]
原来这两个isin 系列的计算相当慢。它上面的方法计算两个系列,然后将它们相加 - 是否有一种(惯用的)方法来短路每个元素,因为第一个系列大多是错误的,所以我们不需要计算其他系列的元素?
【问题讨论】:
标签: python pandas numpy short-circuiting