【发布时间】:2021-12-04 09:16:33
【问题描述】:
我正在编写一个使用datetime、holidays 和dateutil 的Python 脚本来确定YYYY-MM-DD 格式的给定日期是否是交易假日。我正在使用生成器表达式从holidays 库提供的默认假期列表中删除市场未关闭的假期,
import datetime, holidays
import dateutil.easter as easter
def to_date(date_string):
return datetime.datetime.strptime(date_string,'%Y-%m-%d').date()
def is_trading_holiday(date):
us_holidays = holidays.UnitedStates(years=date.year)
# generate list without columbus day and veterans day since markets are open on those days
trading_holidays = [ "Columbus Day", "Columbus Day (Observed)", "Veterans Day", "Veterans Day (Observed)"]
custom_holidays = [ date for date in us_holidays if us_holidays[date] not in trading_holidays ]
# add good friday to list since markets are closed on good friday
custom_holidays.append(easter.easter(year=date.year) - datetime.timedelta(days=2))
return date in custom_holidays
if __name__=="__main__":
first_date = to_date('2020-01-03')
second_date = to_date('2015-11-26') # Thanksgiving
third_date = to_date('2005-01-01') # New Years
fourth_date = to_date('2005-01-07')
print(is_trading_holiday(first_date))
print(is_trading_holiday(second_date))
print(is_trading_holiday(third_date))
print(is_trading_holiday(fourth_date))
我已经针对各种日期对此进行了测试,它似乎在所有情况下都有效,但只有一种情况。当我使用 2005 年的日期时,这个函数会爆炸并告诉我,
Traceback (most recent call last):
File "./test.py", line 26, in <module>
print(is_trading_holiday(third_date))
File "./test.py", line 11, in is_trading_holiday
custom_holidays = [ date for date in us_holidays if us_holidays[date] not in trading_holidays ]
File "./test.py", line 11, in <listcomp>
custom_holidays = [ date for date in us_holidays if us_holidays[date] not in trading_holidays ]
RuntimeError: dictionary changed size during iteration
我不知道 2005 年有什么特别之处导致这个功能崩溃,或者即使是这一年导致了这个问题(我已经测试了这个可以追溯到 70 年代的日期,并且它有效)。我没有修改我在生成器表达式中迭代的字典(否则,我认为不是?),所以我不确定这个错误试图告诉我什么。
有人知道这里发生了什么吗?我错过了什么明显的东西吗?
【问题讨论】:
-
如果您将理解更改为
[date for date, holiday in us_holidays.items() if holiday in trading_holidays],它会改变什么吗? -
看来我的版本可以工作(在移动设备上的 colab 中尝试),所以我的猜测是
__getitem__有时会产生修改底层字典的副作用。 2005 年“元旦(已观察)”发生在 2004 年,但在迭代器中 在元旦之后,这是修改字典的条目,因此它可能是库的实现细节当假期不正常时泄漏?可能值得将其报告为错误。 -
啊,有趣的是,如果您在 2005 年的
us_holidays中的每个条目上使用__getitem__,然后再循环一遍,新年(观察到的)不会出现!显然__getitem__正在从 2004 年开始修剪日期。
标签: python python-datetime python-dateutil generator-expression python-holidays