【发布时间】:2019-03-09 08:26:36
【问题描述】:
有没有比 bdate_range() 更好的方法来通过 pandas 测量两列日期之间的工作日?
df = pd.DataFrame({ 'A' : ['1/1/2013', '2/2/2013', '3/3/2013'],
'B': ['1/12/2013', '4/4/2013', '3/3/2013']})
print df
df['A'] = pd.to_datetime(df['A'])
df['B'] = pd.to_datetime(df['B'])
f = lambda x: len(pd.bdate_range(x['A'], x['B']))
df['DIFF'] = df.apply(f, axis=1)
print df
输出:
A B
0 1/1/2013 1/12/2013
1 2/2/2013 4/4/2013
2 3/3/2013 3/3/2013
A B DIFF
0 2013-01-01 00:00:00 2013-01-12 00:00:00 9
1 2013-02-02 00:00:00 2013-04-04 00:00:00 44
2 2013-03-03 00:00:00 2013-03-03 00:00:00 0
谢谢!
【问题讨论】:
-
可能重复:stackoverflow.com/questions/13019719/…(请参阅底部以计算天数,而不是列出它们。)
-
@DanAllan 感觉就像在做同样的事情,因为你正在创建一个中间日期范围......但是如果不这样做可能是不可能的。 :s
-
是的,当然。如果您正在研究长距离,并且您只需要排除周末(但不包括假期),我希望构建一个自定义函数会更快,该函数使用 A 和 B 的星期几以及它们的总时间差来计算工作日数。
-
在处理上述内容时,我查看了 numpy busday_count,但从元数据 [us] 到 [D] 的转换存在问题。
f = lambda x: np.busday_count(x['A'], x['B']).