【发布时间】:2021-05-22 13:39:31
【问题描述】:
我正在尝试完全匹配在 x86_64 和 aarch64/arm64 上运行的应用程序之间的行为。但是,当浮点数超出可能的整数范围时,它们的转换方式不同。
考虑以下示例:
#include <stdio.h>
#include <cstdint>
void cast(float value) {
printf("uint32_t(%.2f) = %u\n", value, uint32_t(value));
}
int main() {
cast(4294967808.);
}
# output on x86_64: uint32_t(4294967808.00) = 512
# output on aarch64: uint32_t(4294967808.00) = 4294967295
x86_64 版本使用cvttss2si 进行转换,这包含了答案,尽管文档对此并不清楚。 Aarch64 使用的是饱和的fcvtzu。
对齐两者的任何解决方案都会很有趣,但理想情况下,我想在 clang 上设置一个编译器标志,让 aarch64 版本的行为类似于 x86_64 版本(即使 aarch64 “更好”)
【问题讨论】:
-
行为未定义。此外,ARM 对此有特殊说明,因为 javascript 已将这种行为(在 C 中未定义)指定为 x86 的行为,因为 javascript 当然会做这样的事情。因此,为了快速运行 javascript,ARM 必须发明一种指令来做一些没人想要的愚蠢的事情,因为太多人使用的语言很糟糕。
-
@EOF 好吧,定义一个行为并不是一个糟糕的设计选择,返回一个哨兵值也不是天生的坏事。
-
感谢您的回答。你知道那个指令是什么吗,EOF?因为我肯定找不到!
-
其实,EOF,你让我走上了正轨!指令是
fjcvtzs(内在__builtin_arm_jcvt)。谢谢!
标签: c++ clang arm64 floating-point-conversion