指针访问和数组访问之间的值差异答案

【问题标题】：Difference in values between pointer access and array access指针访问和数组访问之间的值差异
【发布时间】：2013-06-26 22:15:50
【问题描述】：

有人可以澄清我的错误解释吗？我知道我的理解是不正确的，因为我的代码产生了输出（见问题的底部）。提前致谢。

为了澄清，下面一行的每个部分是什么意思？：

*(u8 *)((u32)BufferAddress + (u32)i)

它与以下行有何不同：

*(u32 *)((u32)BufferAddress + (u32)i)

我对上面的解释是：

segment1 = ((u32)BufferAddress + (u32)i) => 将地址确定为整数。
segment2 = (u32 *)(segment1) => 将地址转换为指针，其中指针长度为 32 位。
segment3 = *(segment2) => 解引用指针以获得驻留在计算地址处的值。

我的解释有什么不正确的地方？我认为我缺乏理解是在segment2区域......铸造（u32 *）和（u8 *）有什么区别？

这是让我意识到我存在知识差距的代码：

初始化代码：

main(...) {
     ...
     u8 *Buffer = malloc(256);
     ...
     Buffer[0] = 1;
     Buffer[1] = 0;
     Buffer[2] = 0;
     Buffer[3] = 4;
     Buffer[4] = 0;
     Buffer[5] = 0;
     qFunction(... , Buffer, 6, ...);
     ...
}

qFunction(... , const u8 *BufferPointer, u32 BufferLength, ...) {
     u32 BufferAddress;
     ...
     BufferAddress = (u32) BufferPointer;
     ...

     /* Method 1: */
     for (i=0; i < BufferLength; i++)
          printf("%d, %p\n", BufferPointer[i], &BufferPointer[i]);

     /* Method 2: */
     for (i=0; i < BufferLength; i++)
          printf("%d, 0x%lx\n", *(u8 *)(BufferAddress+i), BufferAddress+i);

     /* Method 3: */
     for (i=0; i < BufferLength; i++)
          printf("%d, 0x%lx\n", *(u32 *)(BufferAddress+i), BufferAddress+i);
     ...
 }

方法一和方法二的输出和我预期的一样（都是一样的）：

1, 0x1000000
0, 0x1000001
0, 0x1000002
4, 0x1000003
0, 0x1000004
0, 0x1000005

但是，方法 3 的输出对我来说似乎很奇怪；只有部分结果与方法1/2相同：

-1442840511, 0x1000000
11141120, 0x1000001
43520, 0x1000002
4, 0x1000003
0, 0x1000004
0, 0x1000005

如果有任何关于阅读材料的提示或参考，我将不胜感激。谢谢。

【问题讨论】：

macduff 的回答是正确的，但要添加一条评论；您应该尽可能避免将指针转换为整数，因为这并不是真正必要的，并且如果您决定将来构建 64 位（指针将是 64 位，而不是 32 位），则会导致问题。

标签： c arrays pointers memory

【解决方案1】：

我可以吹毛求疵，说“你没有给我们足够的信息”。从技术上讲，这是正确的，但它只需要做出一些假设。 u8 和 u32 不是标准 C 类型，您可以将它们定义为任何类型，但大概它们代表一个无符号 8 位值（例如 uchar）和一个无符号 32 位值（例如 unsigned )。假设是这样，让我们看看你理解的那些，并解释第三个在哪里。

BufferPointer 是一个 const u8*，这意味着它是一个 u8 类型的常量指针。这意味着它指向的数组是 8 位无符号数组。

现在，BufferAddress 是一个 u32 - 这对于指针来说是典型的，至少在 32 位系统上是这样。因为它们总是总线的大小，所以在 64 位系统上，指针是 64 位的。

所以，Method1 正在打印数组的元素和数组的地址。这很好，很酷。

方法二：

*(u8 *)(BufferAddress+i), BufferAddress+i

BufferAddress 是一个无符号整数，您正在向它添加值以获取其他地址。这是数组的一个基本点——内存是连续的，你可以通过增加每个元素的字节数来访问下一个元素。因为它是一个 u8 数组，所以你只需前进 1。不过，这里有个问题——如果它是一个整数数组，你会想要 BufferAddress+(i*4)，而不是 BufferAddress+i，因为每个 int 的大小是 4字节。顺便说一句，这就是指针算法在 C 中的工作方式。如果您执行 `&(((u32 *)BufferAddress) + 1)，您将得到 0x100004 而不是 0x100001，因为您将 BufferAddress 转换为 4 字节指针，编译器知道当您查看下一个元素时，它必须在 4 个字节之外。

所以(BufferAddress+i)是u8数组的第i个元素的地址。 (u8 *) 将 BufferAddress 从一个无聊的整数转换为指向 u8 类型内存位置的指针，因此当您执行 *(u8 *) 时，编译器知道将其视为 u8。您可以使用(u64 *)，编译器会说“哦！这个内存区域是 64 位的”，并尝试以这种方式解释这些值。

这可能会清楚地说明方法 3 现在发生了什么。您获得了每个数组元素的适当地址，但您告诉编译器“将此内存区域视为 32 位数据”。因此，每次使用 *(u32 *) 时，都会读取数组的 4 个字节并将其视为无符号整数。顺便说一句，一旦 i >= 3，您就会遇到未定义的行为，因为您正在读取数组之外的内容。

让我试着想象一下你在那个区域的记忆是什么样子的：

0x1000000 = 1
0x1000001 = 0
0x1000002 = 0
0x1000003 = 4
0x1000004 = 0
0x1000005 = 0

对于方法 2，当 i = 2 时，您正在查看 BufferAddress (=0x1000000) + 3，即 0x1000002，其中包含数字 0。编译器知道它只有一个字节，所以就这样做了。

但是对于方法 3，当 i = 3 时，您是在告诉编译器将其视为 32 位。所以它看不到'0'，它看到的是0、4、0、0，并用这些数字来得出一个整数值，肯定不会是4。

【讨论】：

【解决方案2】：

*(u8 *)((u32)BufferAddress + (u32)i)
*(u32 *)((u32)BufferAddress + (u32)i)

顶行在取消引用之前将指针转换为无符号的 8 位值，而秒在取消引用之前将其转换为无符号的 32 位值。第一行取消引用单个字节，底部取消引用整个 4 个字节。

解决您的其他问题：

我的解释有什么不正确的地方？我认为我的不足理解在segment2区...有什么区别在转换 (u32 *) 和 (u8 *) 之间？

地址长度为 32 位的解释对于代码的顶部和底部行都是正确的。

【讨论】：