【发布时间】:2018-06-10 05:58:54
【问题描述】:
我有一个指向内存中 malloc 块/数组的指针(void*),并且我知道存储在该块中的数据结构的大小。我希望能够遍历块以访问任何单个值。
程序知道:
那个 void* 指针将指向这个 malloc 的内存块的开始。
每个值的大小[以字节为单位],但不是实际存储的数据结构。
容量[以字节为单位]:这些值的潜在数量(分配了多少内存)
这意味着我已经 malloc'ed:Capacity*Size_of_value 字节,并且我想通过以下方式获取指向该块内任何值的指针:
将 void* 指针转换为 char* 指针。
将所需的 Size_of_value 倍数添加到 char*Pointer:从而获得指向任何所需值的指针。
我学到的是,将 N 添加到 char* 指针会导致它向前移动 N 个字节。而且我知道指针必须向前移动 [amount] 个字节,我可以将 [amount] 添加到这个 char* 指针。
我找不到合适的来源,通常只能确定不允许在 void* 上进行算术运算。
从到目前为止我一起破解的内容来看,它似乎可以正常工作,只要存储的结构具有恒定的已知大小。结构中的一个灵活数组成员破坏了我当前的实现。这是我计划通过创建扩展来解决的一个缺点:列表将保存一个指向指针数组的指针,这些指针将提供对实际值的访问。
可能有用也可能没用的上下文:
我正在研究一个列表数据结构的实现,我将它实现为一个具有更多接口的动态数组(根据需要扩展和收缩)。
我知道链表,我也计划将它们作为一个不同的练习来实现。
我这样定义列表:
typedef struct TLIST_
{
size_t size_of_value; // size [in bytes] of each record stored in the list
size_t list_capacity; // memory has been allocated for this many values(size can't be larger than this)
size_t list_size; // number of stored records
void* pointer_to_zero; // address of the content
} tlist;
// The list has a few other values for various options and operations(e.g.: disallowing it to expand automatically, displaying the content), but those four values is all that's needed for this problem.
获取指向给定索引处的值的指针的函数:
void* tehlist_generic_getPointerToIndex(const tlist* list__, const int index__)
{
const int capacity = (*list__).list_capacity;
if( index__ >= 0 && index__ < capacity )
{
// Move pointer forward by a given amount of bytes, through casting the void* to a char*
// 1. Can't do pointer arithmetic on void*, but can on char*
// 2. char* is defined as 1[unit or byte],
// thus moving char* forward by N, causes it to move as if we were moving through a pointer that was of size N
void* pointer_to_index = (*list__).pointer_to_zero;
const size_t bytes_forward = (*list__).size_of_value*index__;
pointer_to_index = (char*)(pointer_to_index) + ( bytes_forward );
return pointer_to_index;
}
return 0;
}
我发现的其他信息:
GNU C 编译器提供了一个 C 语言扩展,允许在 void* 上进行算术运算,将其视为大小为 1(就像它被转换为 char*):
https://gcc.gnu.org/onlinedocs/gcc/Pointer-Arith.html#Pointer-Arith
这在 ISO C 中是不允许的,只有在 GNU C 中才允许。
【问题讨论】:
-
是的。除非您使用 GCC(或模拟 GCC 的编译器),否则您不能直接在
void *上进行算术运算。因此,您必须转换为指向其他类型的指针,char *通常是最好的选择,但它确实取决于上下文。 -
请注意对包含 FAM(灵活数组成员)的结构的限制:C11 §6.7.2.1 结构和联合说明符:¶3 结构或联合不得包含不完整或函数类型的成员( ...),除了具有多个命名成员的结构的最后一个成员可能具有不完整的数组类型;这样的结构(以及可能递归地包含这样的结构的成员的任何联合)不应是结构的成员或数组的元素。
-
带有 FAM 的结构的大小不包括 FAM 的大小(但结构的大小可能比没有 FAM 的大;例如
struct fam1 { char c; double fam[]; };可能有大小8(在 32 位 Intel 上可能是 4),但如果没有 FAM,则大小为 1)。数组直接在结构的固定部分之后,这就是为什么你不能将它们放在数组中的原因——数组的元素相隔固定距离,所以如果不是为了禁止,你只会是能够拥有一个 struct-with-FAM 数组,其中每个 FAM 都是空的,这是没有意义的。 -
您无法以编程方式判断结构中是否包含 FAM,就像您无法识别非 FAM 成员一样。您可以拥有指向带有 FAM 元素的单独分配结构的指针数组。
-
发布的代码似乎假设
struct TLIST_可以在任何内存地址对齐。在对数据类型有严格对齐限制的硬件上进行尝试可以并且将导致类似SIGSEGV或SIGBUS。