【问题标题】:Difference in values between pointer access and array access指针访问和数组访问之间的值差异
【发布时间】:2013-06-26 22:15:50
【问题描述】:

有人可以澄清我的错误解释吗?我知道我的理解是不正确的,因为我的代码产生了输出(见问题的底部)。 提前致谢。

为了澄清,下面一行的每个部分是什么意思?:

*(u8 *)((u32)BufferAddress + (u32)i)

它与以下行有何不同:

*(u32 *)((u32)BufferAddress + (u32)i)

我对上面的解释是:

  1. segment1 = ((u32)BufferAddress + (u32)i) => 将地址确定为整数。
  2. segment2 = (u32 *)(segment1) => 将地址转换为指针,其中指针长度为 32 位。
  3. segment3 = *(segment2) => 解引用指针以获得驻留在计算地址处的值。

我的解释有什么不正确的地方?我认为我缺乏理解是在segment2区域......铸造(u32 *)和(u8 *)有什么区别?

这是让我意识到我存在知识差距的代码:

初始化代码:

main(...) {
     ...
     u8 *Buffer = malloc(256);
     ...
     Buffer[0] = 1;
     Buffer[1] = 0;
     Buffer[2] = 0;
     Buffer[3] = 4;
     Buffer[4] = 0;
     Buffer[5] = 0;
     qFunction(... , Buffer, 6, ...);
     ...
}

qFunction(... , const u8 *BufferPointer, u32 BufferLength, ...) {
     u32 BufferAddress;
     ...
     BufferAddress = (u32) BufferPointer;
     ...

     /* Method 1: */
     for (i=0; i < BufferLength; i++)
          printf("%d, %p\n", BufferPointer[i], &BufferPointer[i]);

     /* Method 2: */
     for (i=0; i < BufferLength; i++)
          printf("%d, 0x%lx\n", *(u8 *)(BufferAddress+i), BufferAddress+i);

     /* Method 3: */
     for (i=0; i < BufferLength; i++)
          printf("%d, 0x%lx\n", *(u32 *)(BufferAddress+i), BufferAddress+i);
     ...
 }

方法一和方法二的输出和我预期的一样(都是一样的):

1, 0x1000000
0, 0x1000001
0, 0x1000002
4, 0x1000003
0, 0x1000004
0, 0x1000005

但是,方法 3 的输出对我来说似乎很奇怪;只有部分结果与方法1/2相同:

-1442840511, 0x1000000
11141120, 0x1000001
43520, 0x1000002
4, 0x1000003
0, 0x1000004
0, 0x1000005

如果有任何关于阅读材料的提示或参考,我将不胜感激。 谢谢。

【问题讨论】:

  • macduff 的回答是正确的,但要添加一条评论;您应该尽可能避免将指针转换为整数,因为这并不是真正必要的,并且如果您决定将来构建 64 位(指针将是 64 位,而不是 32 位),则会导致问题。

标签: c arrays pointers memory


【解决方案1】:

我可以吹毛求疵,说“你没有给我们足够的信息”。从技术上讲,这是正确的,但它只需要做出一些假设。 u8u32 不是标准 C 类型,您可以将它们定义为任何类型,但大概它们代表一个无符号 8 位值(例如 uchar)和一个无符号 32 位值(例如 unsigned )。假设是这样,让我们​​看看你理解的那些,并解释第三个在哪里。

BufferPointer 是一个 const u8*,这意味着它是一个 u8 类型的常量指针。这意味着它指向的数组是 8 位无符号数组。

现在,BufferAddress 是一个 u32 - 这对于指针来说是典型的,至少在 32 位系统上是这样。因为它们总是总线的大小,所以在 64 位系统上,指针是 64 位的。

所以,Method1 正在打印数组的元素和数组的地址。这很好,很酷。

方法二:

*(u8 *)(BufferAddress+i), BufferAddress+i

BufferAddress 是一个无符号整数,您正在向它添加值以获取其他地址。这是数组的一个基本点——内存是连续的,你可以通过增加每个元素的字节数来访问下一个元素。因为它是一个 u8 数组,所以你只需前进 1。不过,这里有个问题——如果它是一个整数数组,你会想要 BufferAddress+(i*4),而不是 BufferAddress+i,因为每个 int 的大小是 4字节。顺便说一句,这就是指针算法在 C 中的工作方式。如果您执行 `&(((u32 *)BufferAddress) + 1),您将得到 0x100004 而不是 0x100001,因为您将 BufferAddress 转换为 4 字节指针,编译器知道当您查看下一个元素时,它必须在 4 个字节之外。

所以(BufferAddress+i)是u8数组的第i个元素的地址。 (u8 *) 将 BufferAddress 从一个无聊的整数转换为指向 u8 类型内存位置的指针,因此当您执行 *(u8 *) 时,编译器知道将其视为 u8。您可以使用(u64 *),编译器会说“哦!这个内存区域是 64 位的”,并尝试以这种方式解释这些值。

这可能会清楚地说明方法 3 现在发生了什么。您获得了每个数组元素的适当地址,但您告诉编译器“将此内存区域视为 32 位数据”。因此,每次使用 *(u32 *) 时,都会读取数组的 4 个字节并将其视为无符号整数。顺便说一句,一旦 i >= 3,您就会遇到未定义的行为,因为您正在读取数组之外的内容。

让我试着想象一下你在那个区域的记忆是什么样子的:

0x1000000 = 1
0x1000001 = 0
0x1000002 = 0
0x1000003 = 4
0x1000004 = 0
0x1000005 = 0

对于方法 2,当 i = 2 时,您正在查看 BufferAddress (=0x1000000) + 3,即 0x1000002,其中包含数字 0。编译器知道它只有一个字节,所以就这样做了。

但是对于方法 3,当 i = 3 时,您是在告诉编译器将其视为 32 位。所以它看不到'0',它看到的是0、4、0、0,并用这些数字来得出一个整数值,肯定不会是4。

【讨论】:

    【解决方案2】:
    *(u8 *)((u32)BufferAddress + (u32)i)
    *(u32 *)((u32)BufferAddress + (u32)i)
    

    顶行在取消引用之前将指针转换为无符号的 8 位值,而秒在取消引用之前将其转换为无符号的 32 位值。第一行取消引用单个字节,底部取消引用整个 4 个字节。

    解决您的其他问题:

    我的解释有什么不正确的地方?我认为我的不足 理解在segment2区...有什么区别 在转换 (u32 *) 和 (u8 *) 之间?

    地址长度为 32 位的解释对于代码的顶部和底部行都是正确的。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-09-13
      • 1970-01-01
      • 1970-01-01
      • 2021-12-04
      • 1970-01-01
      • 2014-01-03
      • 1970-01-01
      • 2014-03-25
      相关资源
      最近更新 更多