【问题标题】:Does h5py offer a neat simple way to create or use a group or dataset?h5py 是否提供了一种简洁的方法来创建或使用组或数据集?
【发布时间】:2015-12-02 22:11:37
【问题描述】:

我正在使用 h5py 修复一个 python 脚本。它包含如下代码:

hdf = h5py.File(hdf5_filename, 'a')
... 
g = hdf.create_group('foo')
g.create_dataset('bar', ...whatever...)

有时这会在一个已经有一个名为 'foo' 的组的文件上运行,在这种情况下,我会看到“ValueError: Unable to create group (Name already exists)”

解决此问题的一种方法是将一个简单的行替换为 create_group 为四行,如下所示:

if 'foo' in hdf.keys():
    g = hdf['foo']
else:
    g = hdf.create_group['foo']

g.create_dataset(...etc...)

有没有更简洁的方法来做到这一点,也许只有一行?就像标准 C 库中的文件一样,“a”模式将附加到现有文件,或者创建一个文件(如果它不存在)。

数据集也是如此 - 我有

create_dataset('bar', ...) 

但应该先检查:

if 'bar' in g.keys():
   d = g['bar']
else:
   d = g.create_dataset('bar')

我的愿望:找到 h5py 有名为 create_or_use_group() 和 create_or_use_dataset() 的方法。究竟存在什么?

【问题讨论】:

标签: h5py


【解决方案1】:

是的:require_grouprequire_dataset

with h5py.File("/tmp/so_hdf5/test2.h5", 'w') as f:
    a = f.create_dataset('a',data=np.random.random((10, 10)))

with h5py.File("/tmp/so_hdf5/test2.h5", 'r+') as f:
    a = f.require_dataset('a', shape=(10, 10), dtype='float64')
    d = f.require_dataset('d', shape=(20, 20), dtype='float64')
    g = f.require_group('foo')
    print(a)
    print(d)
    print(g)

请注意,您确实需要知道数据集的形状和 dtype,否则 require_dataset 会抛出 TypeError。在这种情况下,您可以执行以下操作:

try:
    a = f.require_dataset('a', shape=(10, 10), dtype='float64')
except TypeError:
    a = f['a']

如果您还不知道形状和 dtype,我认为 require_dataset 与使用 try ... except ... 相比没有太大优势

【讨论】:

    猜你喜欢
    • 2020-01-20
    • 2016-09-24
    • 1970-01-01
    • 2020-10-14
    • 2019-12-06
    • 2015-08-02
    • 1970-01-01
    • 2019-09-30
    相关资源
    最近更新 更多