裸机 ARM Raspberry Pi + qemu 浮点除法的奇怪行为答案

【问题标题】：Bare-metal ARM Raspberry Pi + qemu strange behavior with floating point division裸机 ARM Raspberry Pi + qemu 浮点除法的奇怪行为
【发布时间】：2018-06-16 14:02:53
【问题描述】：

我目前正在自学裸机 ARM 内核开发，在有充分记录的基础上，我决定使用 Raspberry Pi 2 作为目标平台。我目前正在使用 qemu 模拟设备。在我的内核调用的函数中，我需要将数值常数除以函数参数并将结果存储为浮点数以供将来计算。调用这个函数会导致 qemu 脱轨。这是函数本身（设置 PL011 波特率）：

void pl011_set_baud_rate(pl011_uart_t *uart, uint32_t baud_rate) {
    float divider = PL011_UART_CLOCK / (16.0f * baud_rate);
    uint16_t integer_divider = (uint16_t)divider;
    uint8_t fractional_divider = ((divider - integer_divider) * 64) + 0.5;
    mmio_write(uart->IBRD, integer_divider);        // Integer baud rate divider
    mmio_write(uart->FBRD, fractional_divider);     // Fractional baud rate divider
};

我会发布一个可验证的最小示例，但几乎任何事情都会引发问题。如果你甚至使用：

void test(uint32_t test_var) {
    float test_div = test_var / 16;
    (void)test_div;    // squash [-Wunused-variable] warnings
    // goes off the rails here
};

你会得到同样的结果。

单步执行 gdb 中的函数，越过 float divider... 将导致 qemu 跳出函数并直接进入我的引导加载程序代码中的停止循环（当内核主返回时）

在 gdb 中检查 info args 会显示正确的参数。检查info locals 将显示float divider 的正确值。检查info stack 显示正确的堆栈跟踪和参数。最初我怀疑sp 可能在错误的位置，但由于堆栈跟踪看起来很正常，因此无法检查。（裸机）

(gdb) info stack
#0  pl011_set_baud_rate (uart=0x3f201000, baud_rate=115200) at kernel/uart/pl011.c:23
#1  0x0000837c in pl011_init (uart=0x3f201000) at kernel/uart/pl011.c:49
#2  0x0000806c in uart_init () at kernel/uart/uart.c:12
#3  0x00008030 in kernel_init (r0=0, r1=0, atags=0) at kernel/boot/start.c:10
#4  0x00008008 in _start () at kernel/boot/boot.S:6
Backtrace stopped: previous frame identical to this frame (corrupt stack?)
(gdb)

这是导致不可预知行为的行之前的寄存器转储：

r0             0x3f201000       1059065856
r1             0x1c200  115200
r2             0x7ff    2047
r3             0x0      0
r4             0x0      0
r5             0x0      0
r6             0x0      0
r7             0x0      0
r8             0x0      0
r9             0x0      0
r10            0x0      0
r11            0x7fcc   32716
r12            0x0      0
sp             0x7fb0   0x7fb0
lr             0x837c   33660
pc             0x8248   0x8248 <pl011_set_baud_rate+20>
cpsr           0x600001d3       1610613203

我的 Makefile 是：

INCLUDES=include
INCLUDE_PARAMS=$(foreach d, $(INCLUDES), -I$d)

CC=arm-none-eabi-gcc

C_SOURCES:=kernel/boot/start.c kernel/uart/uart.c kernel/uart/pl011.c
AS_SOURCES:=kernel/boot/boot.S

SOURCES=$(C_SOURCES)
SOURCES+=$(AS_SOURCES)

OBJECTS=
OBJECTS+=$(C_SOURCES:.c=.o)
OBJECTS+=$(AS_SOURCES:.S=.o)


CFLAGS=-std=gnu99 -Wall -Wextra -fpic -ffreestanding -mcpu=cortex-a7 -mfpu=neon-vfpv4 -mfloat-abi=hard
LDFLAGS=-ffreestanding -nostdlib

LIBS=-lgcc

DEBUG_FLAGS=

BINARY=kernel.bin

.PHONY: all clean debug

all: $(BINARY)

debug: DEBUG_FLAGS += -ggdb
debug: $(BINARY)

$(BINARY): $(OBJECTS)
    $(CC) -T linker.ld $(LDFLAGS) $(LIBS) $(OBJECTS) -o $(BINARY)

%.o: %.c
    $(CC) $(INCLUDE_PARAMS) $(CFLAGS) $(DEBUG_FLAGS) -c $< -o $@

%.o: %.S
    $(CC) $(INCLUDE_PARAMS) $(CFLAGS) $(DEBUG_FLAGS) -c $< -o $@

clean:
    rm $(BINARY) $(OBJECTS)

如您所见，我正在链接 lgcc，并使用 -mfpu=neon-vfpv4 -mfloat-abi=hard，所以至少 gcc 应该从 lgcc 提供它自己的浮点除法函数。

谁能指出我调试此问题的正确方向？我怀疑我使用了不正确的编译器参数并且没有为浮点除法加载正确的函数，或者堆栈存在一些问题。

任何人都可以在这里发表任何见解吗？

【问题讨论】：

我还没有在内核模式下接触过 ARM 中的浮点单元，但是，在 x86 中，由于惰性上下文切换和你宁愿多花点功夫改为使用整数计算。
这里需要一些相当复杂的体操来避免使用除法！您需要对除法的小数余数执行任意计算，然后将其存储。我可以通过硬编码值来解决所有这些问题，但我也在努力避免这种情况。
您在执行此操作之前是否启用了浮点单元？这是裸机是吗？你必须先启用浮点协处理器，我认为单有一点，双精度有一点……
mrc p15, 0, r0, c1, c0, 2 orr r0,r0,#0x300000 ;@ 单精度 orr r0,r0,#0xC00000 ;@ 双精度 mcr p15, 0, r0, c1 , c0, 2
在原始 pi 上，作为一个完全不同的核心意味着可能根本不起作用。试图找到我在 armv7 上是否/在哪里启用它。顺便说一句，在 pi 网站上有一个非常好的裸机论坛，很多/大多数人都经历过这个。

标签： c arm raspberry-pi2 bare-metal

【解决方案1】：

您是否检查过 fpu 协处理器是否已启用？

在原来的 pi1/pi-zero 我用这个

;@ enable fpu
mrc p15, 0, r0, c1, c0, 2
orr r0,r0,#0x300000 ;@ single precision
orr r0,r0,#0xC00000 ;@ double precision
mcr p15, 0, r0, c1, c0, 2
mov r0,#0x40000000
fmxr fpexc,r0

如果它不起作用，最后几行可能会故意崩溃。

不幸的是，您可能在 pi2 中有 armv7 或 armv8 内核，因为有两种变体。我怀疑无论哪种方式，具体的寄存器和指令可能与上面基于 armv6 的树莓派的不同。

【讨论】：

在ARM manual 中找到了这样的代码。它说最后几行设置了 FPEXC EN 位以启用 FPU。
是的，您必须启用协处理器，在这种情况下，单处理器和双处理器是分别启用的协处理器。
我在某处有 armv7 的代码，必须挖掘它。

【解决方案2】：

脱轨是指调用了您的异常处理程序吗？如果是这样，qemu 有调试选项可以帮助找到引发的异常。检查qemu-system-arm -M raspi2 -d help。

我们可以从启用int,cpu_reset,unimp,guest_errors开始。

【讨论】：