【问题标题】:Linker calculates wrong addresses for rodata section链接器为rodata 部分计算错误的地址
【发布时间】:2019-02-11 23:46:59
【问题描述】:

我为我的问题创建了一个最小示例。在 c 文件中,我初始化了一个包含 16 个元素的数组。然后我用数组指针和它的大小作为参数调用一个函数。该函数本身有效,我已经通过反汇编文件验证了这一点。堆栈指针初始化也可以正常工作。问题是数组指针的函数参数错误。我检查了它,失败的根源在主要部分的最开始。这里指针被存储在堆栈中。

我不明白的是:数组值存储在 .rodata 部分中。本节从 0x1000 开始。所以指向数组的指针也应该是0x1000。在反汇编中,0x1000 被加载到 a5 中(正确的值)。但随后它将地址 a5 的值加载到 a4 中。所以 0x1000 代表一个指向数组指针的指针,这没有任何意义恕我直言。有谁知道我做错了什么?

这里是所有需要的信息:

c 程序:

void test(uint8_t *array, int size){
    for(int i=0; i<size; ++i){
        LED_ADDR = array[i];
    }
}
int main(){
    uint8_t buf[] = {0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15};
    test(buf, 16);
}

链接脚本:

OUTPUT_ARCH( "riscv" )
ROMSIZE = 0x1000;
ROM_OFFSET = 0x0000;
RAMSIZE = 0x1000;
RAM_OFFSET = 0x1000;
/* provide variables for startup code (stack init) */
STACK_TOP = ( RAMSIZE + RAM_OFFSET - 4 );
ENTRY (start)
MEMORY {
    rom (rx) : ORIGIN = ROM_OFFSET, LENGTH = ROMSIZE
    ram (!rx) : ORIGIN = RAM_OFFSET, LENGTH = RAMSIZE
}
SECTIONS {
    .reset : { <PROJECTPATH>/obj/startup.o } > rom    /* startup code */
    .text : { *(.text) } > rom                        /* executable data */
    .rodata : { *(.rodata) } > ram                    /* read only data */
    .sdata : { *(.sdata) } > ram                      /* init vars */
    .bss (NOLOAD) : { *(.bss) FILL(0x0f); } > ram     /* uninit data */
}

反汇编文件重要部分: -in .text,main() 的开头:我假设数组的指针应该存储在堆栈中:

80:  000017b7    lui     a5,0x1      # a5 = first ram addr: begin of .rodata
84:  0007a703    lw      a4,0(a5)    # a4 = content of this addr?!?!?!
88:  fee42023    sw      a4,-32(s0)  # a4 gets stored on stack

-.rodata,包含数组的值:

Disassembly of section .rodata:
00001000 <.rodata>:
1000:   0100
1002:   0302
1004:   0504
...
100e:   0f0e

编辑:

我的 CPU 是哈佛架构,无法直接访问 ROM 中的数据。所以 .rodata 和 .data 必须在 RAM 中。我的做法是程序进程将指令写入 ROM,同时将 .rodata 和 .data 写入 RAM。我的硬件实现有助于实现这一点。 (我的一个脚本将二进制文件的这两个数据块分开,并以我的程序单元可以处理的协议对其进行转码。)

乍一看二进制文件是有效的:.text 位于 ROM 的地址空间中,.rodata 和 .data 位于 RAM 的地址空间中。但是链接器计算的 .rodata 的地址是错误的。

我的这个程序只是为了测试它的功能,否则我不会写这样的代码。 (优化标志也是-o0。)

首先,我想了解 main() 开头的那几行,它们应该将数组指针放入堆栈。

80:  000017b7    lui     a5,0x1      # a5 = first ram addr: begin of .rodata
84:  0007a703    lw      a4,0(a5)    # a4 = content of this addr?!?!?!
88:  fee42023    sw      a4,-32(s0)  # a4 gets stored on stack

为什么链接器将 .rodata 的开头视为指向数组的指针,而不是数组的实际地址?

【问题讨论】:

  • i 在您的代码中未初始化。在深入挖掘之前,请先修复编译器报告为警告的基本问题。
  • 我在这里手动输入的,它没有被复制。在原始代码中,它已正确初始化。不过谢谢你的提示,我更正了。
  • minimal reproducible example 是从您编译的代码中逐字复制的代码,并验证它正在重现问题。在这里吗?
  • 为什么链接描述文件将只读数据.rodata放在RAM中?
  • 我已将其添加到我的问题中。

标签: c assembly linker disassembly linker-scripts


【解决方案1】:

我发现这里发生了什么:在 main 的开头,存储在 RAM 中 .rodata 的值被完全复制到堆栈中。因此,数组的指针现在指向堆栈而不是.rodata。这不是最优的,我可能必须找到一种方法来优化它并删除冗余数据。但无论如何这应该有效。我忘记了不仅要初始化堆栈指针,还要初始化帧指针。我的硬件还有另一个错误。这就是为什么它没有奏效。感谢您的帮助!

【讨论】:

    【解决方案2】:

    你的链接描述文件中有很多奇怪的东西

    1. .rodata 通常位于 ROM 中

      .rodata : { *(.rodata) } > ROM
      
    2. .data 在 RAM 中,但在启动期间从 ROM 复制数据:

      .data : { *(.data) } > ram AT > rom 
      
    3. 您的局部变量 buff 不必从 .rodata 初始化。编译器可能会对其进行优化,以存储代码中的立即值。它可以完全优化它并内联测试功能。由于代码非常简单,因此有许多可能的优化。制作buffvolatile然后编译。

    【讨论】:

    • 我还推荐static const buf[]volatile static const buf[]。如果没有static const,编译器仍然可能将其复制到堆栈中(可能来自立即数)。但是,是的,volatile 将阻止编译器完全展开循环并使用立即数。
    • 我已将其添加到我的问题中。
    猜你喜欢
    • 1970-01-01
    • 2021-05-15
    • 1970-01-01
    • 2023-04-02
    • 1970-01-01
    • 1970-01-01
    • 2017-11-23
    • 2012-08-01
    • 1970-01-01
    相关资源
    最近更新 更多