【发布时间】:2011-02-02 20:12:55
【问题描述】:
我想获取一些 C 结构中的部分数据以部分序列化/反序列化它们,将字节从内存写入磁盘,反之亦然。
这些结构是事先不知道的,它们是用我自己的 C 代码生成器(以及将序列化它的代码)动态构建的。可序列化的字段将放置在结构的开头。
假设一个结构体有 4 个字段,前两个要序列化:
typedef struct {
int8_t x1;
int32_t x2; /* 1 + 4 = 5 bytes (if packed) */
int8_t y1;
int32_t y2; /* 1 + 4 +1 + 4 = 10 bytes (if packed) */
} st;
我计划获取指向结构变量的指针并写入/读取覆盖这两个第一个字段 (x1, x2) 的 n 字节。我认为我不需要担心对齐/打包,因为我不打算让序列化在不同的编译中存活下来(预计只有一个唯一的可执行文件来读取/写入数据)。而且,由于我的目标是广泛的编译器架构,我不想对对齐打包或编译器特定的技巧进行假设。
然后,我需要计算字节数。而且我不能只做sizeof(st.x1)+sizeof(st.x2) 因为alingment-padding。所以,我打算减去指针,从结构的开头到第一个“非持久”字段:
st myst;
int partsize = (char*)&myst.y1 - (char*)(&myst);
printf("partial size=%d (total size=%d)\n",partsize,sizeof(myst));
这似乎有效。并且可以放在宏中。
(作为记录:我还尝试编写另一个不需要结构实例的宏,例如this,但在这里似乎不可能 - 但这对我来说并不重要)。
我的问题:这是正确和安全的吗?你能看到任何潜在的陷阱,或者更好的方法吗?
除此之外:C 标准(和事实上的编译器)是否假定结构字段在内存中的顺序与它们在源代码中定义的顺序相同?这可能是一个愚蠢的问题,但我想确定......
更新:从答案和我自己的发现中得出的一些结论:
我的方法似乎没有问题。特别是,C 规定结构字段永远不会改变顺序。
也可以(如 aswer 所建议的)从最后一个持久字段计数并添加其大小:
(char*)&myst.x2 + sizeof(&myst.x2) - (char*)(&myst)。这将是等效的,只是它不包括最后一个字段的填充字节(如果存在)。一个非常小的优势 - 一个非常小的劣势,就是不那么简单。但接受的答案,
offsetof,似乎比我的建议更可取。它是清晰的表达和纯粹的编译时,它不需要结构的实例。它进一步似乎是标准的,可在任何编译器中使用。 如果不需要编译时构造,并且有可用的结构实例(如我的场景),那么两种解决方案本质上是等效的。
【问题讨论】:
-
我删除了 C++ 标签,因为这个问题附近没有 C++。