【发布时间】:2020-08-11 19:46:04
【问题描述】:
我有一个地理范围超过一年的每小时 netCDF 气候数据,例如从2017-01-01T00:00:00 到2017-12-31T23:00:00。
<xarray.Dataset>
Dimensions: (latitude: 106, longitude: 193, time: 8760)
Coordinates:
* latitude (latitude) float32 -39.2 -39.149525 ... -33.950478 -33.9
* longitude (longitude) float32 140.8 140.84792 140.89584 ... 149.95209 150.0
* time (time) datetime64[ns] 2017-01-01 ... 2017-12-31T23:00:00
Data variables:
T_SFC (time, latitude, longitude) float32 dask.array<shape=(8760, 106, 193), chunksize=(744, 106, 193)>
Attributes:
creationTime: 1525708833
creationTimeString: Mon May 7 09:00:32 PDT 2018
Conventions: COARDS
正如它所说的那样,数据具有三个坐标(lat、lng 和 time)和一个变量是每小时温度。
我的代码:
import xarray as xr
mds_temp_path = '../Archive/*/IDV71000_VIC_T_SFC.nc' # netCDF
mds_temp = xr.open_mfdataset(mds_temp_path) # open netCDF and read into a dataset object
print(mds_temp.groupby('time.dayofyear').mean('time'))
我得到了什么:
<xarray.Dataset>
Dimensions: (dayofyear: 365, latitude: 106, longitude: 193)
Coordinates:
* latitude (latitude) float32 -39.2 -39.149525 ... -33.950478 -33.9
* longitude (longitude) float32 140.8 140.84792 140.89584 ... 149.95209 150.0
* dayofyear (dayofyear) int64 1 2 3 4 5 6 7 8 ... 359 360 361 362 363 364 365
Data variables:
T_SFC (dayofyear, latitude, longitude) float64 dask.array<shape=(365, 106, 193), chunksize=(1, 106, 193)>
我希望能够获得每天的平均温度值,例如生成的数据集中的时间坐标是“2017-01-01”、“2017-01-02”、“2017-01-03”、……、“2017-12-31”,而不是 1 , 2, 3, ... ..., 365。
【问题讨论】:
标签: python pandas netcdf python-xarray