【发布时间】:2020-11-10 01:13:03
【问题描述】:
这是我第一次提出问题,如果我需要添加任何进一步的信息,请告诉我。
我正在尝试访问 Google Cloud Storage 上公共存储桶中的对象数据,但数据为 NetCDF 格式。我想提取数据并避免在本地下载数据。类似于netCDF4 库如何从使用 DAP 协议的 URL 访问数据。我需要能够同时访问多个链接中的数据,这样我就可以为我正在处理的一个更大的项目自动化 URL 链接。
Here is a link to one of the objects I will be using
如果您单击链接 URL,则文件将下载到 NetCDF。
我知道您可以使用 gsutil 或 HTTP 客户端(如请求)来获取链接,但之后有没有办法访问存储在 NetCDF 文件中的数据?
编辑:
这是我的代码使用下载的 NetCDF 文件的样子
输入:
import netCDF4 as nc
from netCDF4 import *
link = nc.Dataset('nwm.20200501_short_range_nwm.t00z.short_range.channel_rt.f001.conus.nc')
link
输出:
<class 'netCDF4._netCDF4.Dataset'>
root group (NETCDF4 data model, file format HDF5):
featureType: timeSeries
proj4: +proj=lcc +units=m +a=6370000.0 +b=6370000.0 +lat_1=30.0 +lat_2=60.0 +lat_0=40.0 +lon_0=-97.0 +x_0=0 +y_0=0 +k_0=1.0 +nadgrids=@
model_initialization_time: 2020-05-01_00:00:00
station_dimension: feature_id
model_output_valid_time: 2020-05-01_01:00:00
model_total_valid_times: 18
stream_order_output: 1
cdm_datatype: Station
Conventions: CF-1.6
code_version: v5.1.0-beta2
NWM_version_number: v2.0
model_output_type: channel_rt
model_configuration: short_range
dev_OVRTSWCRT: 1
dev_NOAH_TIMESTEP: 3600
dev_channel_only: 0
dev_channelBucket_only: 0
dev: dev_ prefix indicates development/internal meta data
dimensions(sizes): feature_id(2729077), time(1), reference_time(1)
variables(dimensions): int32 time(time), int32 reference_time(reference_time), |S1 crs(), int32 feature_id(feature_id), int32 streamflow(feature_id), int32 nudge(feature_id), int32 velocity(feature_id), int32 qSfcLatRunoff(feature_id), int32 qBucket(feature_id), int32 qBtmVertRunoff(feature_id)
groups:
我目前正在使用requests API,但我想知道是否可以使用此方法访问上述相同的数据?
import requests as req
r = req.get('https://storage.cloud.google.com/national-water-model/nwm.20200501/short_range/nwm.t00z.short_range.channel_rt.f001.conus.nc')
【问题讨论】:
标签: python-requests google-cloud-storage netcdf gsutil