【问题标题】:Selecting particular months over a range of years pandas在一系列年份中选择特定月份 pandas
【发布时间】:2021-06-20 14:38:50
【问题描述】:

我导入了一个时间序列,我重新采样到每月时间步长,但是我想选择只有 3 月、4 月和 5 月(第 3、4 和 5 个月)的所有年份。

很遗憾,由于它是一个特定的文本文件,所以这不是完全可重复的数据,但是有没有办法隔离这个时间序列的所有月份 3、4 和 5?

# loading textfile

mjo = np.loadtxt('.../omi.1x.txt')

# setting up dates
dates = pd.date_range('1979-01', periods=mjo.shape[0], freq='D')

#resampling one of the columns to monthly data
MJO_amp = Series(mjo[:,6], index=dates) 

MJO_amp_month = MJO_amp.resample("M").mean()[:-27] #match to precipitation time series (ends feb 2019)

MJO_amp_month_normed = (MJO_amp_month - MJO_amp_month.mean())/MJO_amp_month.std()

MJO_amp_month_normed

1979-01-31    0.032398
1979-02-28   -0.718921
1979-03-31    0.999467
1979-04-30   -0.790618
1979-05-31    1.113730
                ...   
2018-10-31    0.198834
2018-11-30    0.221942
2018-12-31    1.804934
2019-01-31    1.359485
2019-02-28    1.076308
Freq: M, Length: 482, dtype: float64


print(MJO_amp_month_normed['2018-10'])

2018-10-31    0.198834
Freq: M, dtype: float64

我的想法是这样的:

def is_amj(month):
    return (month >= 4) & (month <= 6)

seasonal_data = MJO_amp_month_normed.sel(time=is_amj(MJO_amp_month_normed))

但我认为我的问题是文本文件不完全是 pandas 格式并且没有列标题...

【问题讨论】:

  • 如果你的索引是datatime dtype,那么你可以使用df[df.index.month.isin([3,4,5])]
  • 非常感谢!这行得通!随意添加您的解决方案作为答案,我会将其标记为正确。谢谢!

标签: pandas numpy text-files jupyter


【解决方案1】:

您可以像这样使用pd.DatetimeIndexmonth 属性和isin

df[df.index.month.isin([3,4,5])]

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-11-28
    • 2021-06-16
    • 2015-04-03
    • 1970-01-01
    • 2022-07-06
    • 2011-03-21
    • 1970-01-01
    相关资源
    最近更新 更多