模数（浮点数）与分支答案

【问题标题】：Modulus (Float) vs Branch模数（浮点数）与分支
【发布时间】：2019-04-19 20:28:57
【问题描述】：

给定 2 个执行相同操作的表达式 ([-3.14, 3.14] -> [0, 6.28])：

a > 0? a : a + 6.28

或

fmod(a + 6.28, 6.28)

两者在性能上是否存在普遍差异？

编辑： 假设这样的表达式被多次调用（这样性能是相关的）并且输入a 每次都不同。（使问题更直接地回答）。

【问题讨论】：

【解决方案1】：

// Tertiary
t = a > 0? a : a + 6.28
// vs fmod
m = fmod(a + 6.28, 6.28)

两者在性能上是否存在普遍差异？

当然，分析是最好的@NathanOlive，但作为一般指南，请考虑优化潜力。

编译器通常会优化a 类型的整个范围，而不是[-3.14, 3.14]。 t，一个简单的计算，很容易优化。

此外，取决于FLT_EVAL_METHOD，在C 中，m 计算被强制转换为double，当然还有一个函数调用。更多的限制意味着更少的优化可能性。 t 可以使用最佳的 FP 宽度。

推荐 a > 0 ? a : a + 6.28 作为一般首选方法。

给定两个做同样事情的表达式

但是他们不在域[-3.14, 3.14]上做同样的事情

大约 1/4 的 double 在 [0...1.0] 范围内。 m 使用 a + 6.28 将失去至少 3 到所有位的精度。优势：t.

范围不同：
t 的范围是 [0, 6.28]
m的范围是[0, 6.28)，不是[0, 6.28]

考虑更高的目标

很明显，代码正在尝试减少三角函数范围。做好这件事比基本的正弦更难。余弦，切线计算本身。见ARGUMENT REDUCTION FOR HUGE ARGUMENTS: Good to the Last Bit。

如果代码以度数而不是弧度开头，请首先考虑以度数为单位的advantages。

大图

根据a 的派生方式或t、m 的使用方式，甚至可能有更好的性能想法。因此，如果性能确实是一个问题，则需要周围的代码，否则我们会错误地进行微优化。

【讨论】：