double 到 string 到 double 的转换会引发异常答案

【问题标题】：conversion of double to string to double throws exceptiondouble 到 string 到 double 的转换会引发异常
【发布时间】：2015-10-17 15:10:01
【问题描述】：

以下代码在 Visual Studio 2013 中引发 std::out_of_range 异常，我认为它不应该：

#include <string>
#include <limits>

int main(int argc, char ** argv)
{
    double maxDbl = std::stod(std::to_string(std::numeric_limits<double>::max()));

    return 0;
}

我也用 gcc 4.9.2 测试了代码，它没有抛出异常。该问题似乎是由转换为字符串后的字符串表示不准确引起的。在 Visual Studio 中 std::to_string(std::numeric_limits<double>::max()) 产生

179769313486231610000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000.000000 P>

这确实看起来太大了。然而，在 gcc 中，它会产生

179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368.000000 P>

这似乎小于传递的值。

但是，std::numeric_limits<double>::max() 不应该返回

最大有限可表示浮点数？

那么为什么字符串表示会消失呢？我在这里错过了什么？

【问题讨论】：

to_string 等价于某种形式的sprintf，因此似乎会遇到与this question 中相同的问题
但是std::numeric_limits<double>::max() 应该可以用二进制精确表示，所以不需要四舍五入，不是吗？
@sigy：当然，这并不意味着它完全可以用十进制表示。
你用的是什么VS？在 2015 年，我得到 1.7976931348623157e+308 的双精度值和 179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368.000000 的字符串值
@lightness：它是一个整数，尽管它非常大，所以它必须在任何基数中都可以精确表示。

标签： c++ visual-studio gcc type-conversion

【解决方案1】：

直接回答

Gcc（以及 Clang 和 VS2105）正确返回 (2¹⁰²⁴ - 1) - (2^1024-53 - 1) 的整数值，即表示具有 52 个有效位和 1023 的无偏指数（2¹⁰²⁴ - 1 将是具有 1023 个位的整数值，我只是减去 IEE754 格式的 52 以下的所有位）

我可以确认一个大整数库给179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368L

前一个精确浮点数会小 2⁹⁷¹ (971 = 1023 - 52)，即：179769313486231550856124328384506240234343437157459335924404872448581845754556114388470639943126220321960804027157371570809852884964511743044087662767600909594331927728237078876188760579532563768698654064825262115771015791463983014857704008123419459386245141723703148097529108423358883457665451722744025579520L

下一个不可表示的值将大于 2⁹⁷¹，即： 179769313486231590772930519078902473361797697894230657273430081157732675805500963132708477322407536021120113879871393357658789768814416622492847430639474124377767893424865485276302219601246094119453082952085005768838150682342462881473913110540827237163350510684586298239947245938479716304835356329624224137216L

但MSVC2013及之前使用的值接近2¹⁰²⁴ + 2⁹⁷¹，即：179769313486231610731333614426100589925524828262616317947942685512308090830973387504827396012048193870699768806228404251083258210739369062217227314575410731769485876273179688476358949112102859294830297395714877595371718127781702814782017661749531126051903195165027873311156314696040132728420308633064323416064L .由于它大于 IEEE754 双精度可表示的任何值，因此无法解码为双精度。

因为最多可以说 2¹⁰²⁴ - 2⁹⁷¹ (std::numeric_limits<double>::max()) 和 2¹⁰²⁴ 之间的任何值舍入为std::numeric_limits<double>::max()，但大于 2¹⁰²⁴ 的值显然是溢出。

关于准确性的讨论

只有 16 位十进制数字在 double 中是准确的，所有其他数字都可以被视为垃圾或随机值，因为它们不依赖于值本身，而仅取决于您选择的一种计算方式。只需尝试将 1e+288（这已经是一个大值）减去 maxDbl 并看看会发生什么：

maxLess = max Dbl - 1.e+288;
if (maxLess == maxDbl) {
   std::cout << "Unchanged" << std::endl;
}
else std::cout << "Changed" << std::endl;

您应该会看到...未更改。

看起来 VS 2013 在舍入浮点值的方式上有点不连贯：它将 maxDbl 过度舍入到比实际可表示的最大值高一位，并且无法对其进行解码稍后。

问题在于标准选择使用%f 格式，这会导致错误的准确性。如果您想在 gcc 中查看等效问题，只需使用：

#include <iostream>
#include <string>
#include <limits>
#include <iomanip>
#include <sstream>

int main() {
    double max = std::numeric_limits<double>::max();
    std::ostringstream ostr;
    ostr << std::setprecision(16) << max;
    std::string smax = ostr.str();
    std::cout << smax << std::endl;
    double m2 = std::stod(smax);
    std::cout << m2 << std::endl;

    return 0;
}

四舍五入到 16 位 mxDbl 写入（正确）：1.797693134862316e+308，但无法再解码回来

还有这个：

#include <iostream>
#include <string>
#include <limits>

int main() {
    double maxDbl = std::numeric_limits<double>::max();
    std::string smax = std::to_string(maxDbl);
    std::cout << smax << std::endl;
    
    std::string smax2 = "179769313486231570800000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000.000000";

    double max2 = std::stod(smax2);
    if (max2 == maxDbl) {
       std::cout << smax2 << " is same double as " << smax << std::endl;
    }

    return 0;
}

显示：

179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368.000000
179769313486231570800000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000.000000 is same double as 179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368.000000

TL/DR：我的意思是，一个大的双精度值当然可以用一个精确的整数表示（根据 IEEE754）。但它确实代表了一半到前一个和一半到下一个之间的所有整数。因此，该范围内的任何整数都可以是双精度数的可接受表示，并且 16 位十进制数字的一个值 四舍五入 应该是可以接受的，但是当前的标准库只允许最大浮点值被截断 16 位十进制数字。但是 VS2013 给出了一个超出范围最大值的数字，无论如何都是错误的。

参考

IEEE floating point on wikipedia

【讨论】：

我不明白你的意思。当然减去 1e+288 不会改变值，因为会涉及舍入。下一个完全可表示的最小数字应该是1.7976931348623155e+308，即DBL_MAX - 2e+292，在我的情况下，DBL_MAX 也是1.7976931348623158e+308。它正好有你提到的16位数字。在 IEEE754 中表示，这应该是 0111111111101111111111111111111111111111111111111111111111111111，因此它应该可以用双精度浮点数表示。为什么要进行四舍五入？
@sigy：我已经编辑了我的帖子。我希望它更清楚。
我同意1.7976931348623158e+308 是1.7976931348623158e+308 - 1e+288 的有效浮点表示。但是，在我看来，VS2013 和 GCC 4.9.2 中 to_string 返回的字符串表示形式不是。而且我看不出有什么理由会发生这种不准确。在 16 位后截断的返回值仍与传递给方法的值不同。 C++ 标准允许这样的不准确吗？如果有，为什么？