【问题标题】:unaligned access with memcpy与 memcpy 的非对齐访问
【发布时间】:2016-02-14 01:58:59
【问题描述】:

我正在使用 netif 结构(类似于 http://www.nongnu.org/lwip/structnetif.html),我遇到了一个与对齐有关的问题。我注意到每个 int 都从一个 4 倍数的地址开始(例如 0x20010db0)。但是,让我们看一下以下内容:

struct netif {

...

u8_t    hwaddr_len (at address 0x20010db8)

u8_t[8] hwaddr (at address 0x20010db9)

u8_t    mtu (at address 0x20010dc1)

...

}

据我了解,hwaddr_len 在 4 个字节上对齐,hwaddr 在 1 个字节上“对齐”(因为它是 u8_t,这不是在 4 个字节(32 位)上对齐),mtu 在 1 上是“对齐”字节。之后,该结构的所有其他成员再次对齐 4 个字节。所以,我认为这应该很好,即使 hwaddr 在 4 字节多路器上没有对齐,但是当我尝试从“src”到 hwaddr 进行 memcpy 时,我得到了一个未对齐的访问错误。

我正在使用 arm gcc 编译器进行编译。有人知道它为什么会失败吗?

Ps : 我对 ARM 对齐问题了解不多,如果我的问题看起来很明显,请见谅。

编辑:

编译器版本:gcc-arm-none-eabi-4_9-2015q3

失败的部分:

lpwif_get_slla(struct lpwif *lpwif, void *lla, unsigned char lla_len)
{
WpanDeviceP dev = lpwif->dev->wpan;
unsigned char len = 0;

if (lla_len >= 8) {
    if (lpwif->eui[0] == 0xff) {
        /* Fetch WPAN Device's Long Address. */
        uint64_t addr64;
        memset(&addr64, 0xff, sizeof(addr64));
        WpanGet(dev, WpanPibAttr_macExtendedAddress, &addr64, 8);

        /* Always return address in network-byte order */
        lpwif->eui[0] = (addr64 >> 56) & 0xff;
        lpwif->eui[1] = (addr64 >> 48) & 0xff;
        lpwif->eui[2] = (addr64 >> 40) & 0xff;
        lpwif->eui[3] = (addr64 >> 32) & 0xff;
        lpwif->eui[4] = (addr64 >> 24) & 0xff;
        lpwif->eui[5] = (addr64 >> 16) & 0xff;
        lpwif->eui[6] = (addr64 >>  8) & 0xff;
        lpwif->eui[7] = (addr64 >>  0) & 0xff;
    }
    if (lpwif->eui[0] == 0xff) return 0; /* Device has no EUI-64 address. */
    if (lla) memcpy(lla, lpwif->eui, 8);
}

并且这个方法被`lpwif_get_slla(&state->lpwif, netif->hwaddr, 8);调用

反汇编:

   if (lpwif->eui[0] == 0xff) return 0; /* Device has no EUI-64 address. */

 10098ac:   6bfb        ldr r3, [r7, #60]   ; 0x3c
 10098ae:   f893 3024   ldrb.w  r3, [r3, #36]   ; 0x24
 10098b2:   2bff        cmp r3, #255    ; 0xff
 10098b4:   d101        bne.n   10098ba <lpwif_get_slla+0x10e>
 10098b6:   2300        movs    r3, #0
 10098b8:   e07f        b.n 10099ba <lpwif_get_slla+0x20e>

   if (lla) memcpy(lla, lpwif->eui, 8);

 10098ba:   6bbb        ldr r3, [r7, #56]   ; 0x38
 10098bc:   2b00        cmp r3, #0
 10098be:   d006        beq.n   10098ce <lpwif_get_slla+0x122>
 10098c0:   6bfb        ldr r3, [r7, #60]   ; 0x3c
 10098c2:   3324        adds    r3, #36 ; 0x24
 10098c4:   6bb8        ldr r0, [r7, #56]   ; 0x38
 10098c6:   4619        mov r1, r3
 10098c8:   2208        movs    r2, #8
 10098ca:   4b3f        ldr r3, [pc, #252]  ; (10099c8 <lpwif_get_slla+0x21c>)
 10098cc:   4798        blx r3

    return 8;

 10098ce:   2308        movs    r3, #8
 10098d0:   e073        b.n 10099ba <lpwif_get_slla+0x20e>

【问题讨论】:

  • memcpy 将为您处理对齐。一些 ARM CPU 能够进行非对齐访问。你确定你的构建和运行系统之间没有冲突吗?您能否提供正在使用的“C”代码 sn-p 以及发生未对齐异常的汇编程序列表。这些细节将帮助某人回答。如果您通过强制转换对对齐“撒谎”,那么编译可能会生成会导致“未对齐”异常的代码。
  • 你能发布它失败的代码吗?
  • 什么是src,以及您是如何调用memcpy 的(即此处未显示的代码中是否存在任何未定义的行为诱导指针转换)?另外,您使用的是什么实际版本的 GCC? (我相信一些非常旧版本中的 ARM 后端有时会针对未对齐的加载/存储发出不正确的指令)
  • 很高兴看到导致错误的指令地址,以及导致错误的读取地址,但我猜调用 lpwif_get_slla() 正在传递一个强制转换lpwif 的指针(即一些非字对齐的缓冲区),当它得到 lpwif-&gt;eui 时,它正在尝试对非字对齐的地址和 barfing 执行 ldr。
  • 嗯,相对最新的 GCC 4.9 可以很好地配置为默认针对 ARMv7。正如第一条评论所暗示的那样,如果您无意中让编译器认为可能未对齐的单字加载/存储很好,但是然后尝试在并非如此的情况下在 ARM9 或 Cortex-M0 之类的东西上运行,即使代码本身 100% 正确,这也可能导致问题。

标签: c arm memcpy


【解决方案1】:

尝试用带有简单 for 循环的副本替换 memcpy。假设它是内存对齐的,编译器可能正在优化它。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-10-02
    • 1970-01-01
    • 1970-01-01
    • 2022-01-22
    • 2016-11-26
    • 2015-07-23
    • 1970-01-01
    • 2017-02-11
    相关资源
    最近更新 更多