【问题标题】:conversion of double to string to double throws exceptiondouble 到 string 到 double 的转换会引发异常
【发布时间】:2015-10-17 15:10:01
【问题描述】:

以下代码在 Visual Studio 2013 中引发 std::out_of_range 异常,我认为它不应该:

#include <string>
#include <limits>

int main(int argc, char ** argv)
{
    double maxDbl = std::stod(std::to_string(std::numeric_limits<double>::max()));

    return 0;
}

我也用 gcc 4.9.2 测试了代码,它没有抛出异常。该问题似乎是由转换为字符串后的字符串表示不准确引起的。在 Visual Studio 中 std::to_string(std::numeric_limits&lt;double&gt;::max()) 产生

179769313486231610000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000.000000 P>

这确实看起来太大了。然而,在 gcc 中,它会产生

179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368.000000 P>

这似乎小于传递的值。

但是,std::numeric_limits&lt;double&gt;::max() 不应该返回

最大有限可表示浮点数?

那么为什么字符串表示会消失呢?我在这里错过了什么?

【问题讨论】:

  • to_string 等价于某种形式的sprintf,因此似乎会遇到与this question 中相同的问题
  • 但是std::numeric_limits&lt;double&gt;::max() 应该可以用二进制精确表示,所以不需要四舍五入,不是吗?
  • @sigy:当然,这并不意味着它完全可以用十进制表示。
  • 你用的是什么VS?在 2015 年,我得到 1.7976931348623157e+308 的双精度值和 179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368.000000 的字符串值
  • @lightness:它是一个整数,尽管它非常大,所以它必须在任何基数中都可以精确表示。

标签: c++ visual-studio gcc type-conversion


【解决方案1】:

直接回答

Gcc(以及 Clang 和 VS2105)正确返回 (21024 - 1) - (21024-53 - 1) 的整数值,即表示具有 52 个有效位和 1023 的无偏指数(21024 - 1 将是具有 1023 个位的整数值,我只是减去 IEE754 格式的 52 以下的所有位)

我可以确认一个大整数库给179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368L

前一个 精确 浮点数会小 2971 (971 = 1023 - 52),即:179769313486231550856124328384506240234343437157459335924404872448581845754556114388470639943126220321960804027157371570809852884964511743044087662767600909594331927728237078876188760579532563768698654064825262115771015791463983014857704008123419459386245141723703148097529108423358883457665451722744025579520L

下一个不可表示的值将大于 2971,即: 179769313486231590772930519078902473361797697894230657273430081157732675805500963132708477322407536021120113879871393357658789768814416622492847430639474124377767893424865485276302219601246094119453082952085005768838150682342462881473913110540827237163350510684586298239947245938479716304835356329624224137216L

但MSVC2013及之前使用的值接近21024 + 2971,即:179769313486231610731333614426100589925524828262616317947942685512308090830973387504827396012048193870699768806228404251083258210739369062217227314575410731769485876273179688476358949112102859294830297395714877595371718127781702814782017661749531126051903195165027873311156314696040132728420308633064323416064L .由于它大于 IEEE754 双精度可表示的任何值,因此无法解码为双精度。

因为最多可以说 21024 - 2971 (std::numeric_limits&lt;double&gt;::max()) 和 21024 之间的任何值舍入为std::numeric_limits&lt;double&gt;::max(),但大于 21024 的值显然是溢出。


关于准确性的讨论

只有 16 位十进制数字在 double 中是准确的,所有其他数字都可以被视为垃圾或随机值,因为它们不依赖于值本身,而仅取决于您选择的一种计算方式。只需尝试将 1e+288(这已经是一个 值)减去 maxDbl 并看看会发生什么:

maxLess = max Dbl - 1.e+288;
if (maxLess == maxDbl) {
   std::cout << "Unchanged" << std::endl;
}
else std::cout << "Changed" << std::endl;

您应该会看到...未更改。

看起来 VS 2013 在舍入浮点值的方式上有点不连贯:它将 maxDbl 过度 舍入到比实际可表示的最大值高一位,并且无法对其进行解码稍后。

问题在于标准选择使用%f 格式,这会导致错误的准确性。如果您想在 gcc 中查看等效问题,只需使用:

#include <iostream>
#include <string>
#include <limits>
#include <iomanip>
#include <sstream>

int main() {
    double max = std::numeric_limits<double>::max();
    std::ostringstream ostr;
    ostr << std::setprecision(16) << max;
    std::string smax = ostr.str();
    std::cout << smax << std::endl;
    double m2 = std::stod(smax);
    std::cout << m2 << std::endl;

    return 0;
}

四舍五入到 16 位 mxDbl 写入(正确):1.797693134862316e+308,但无法再解码回来

还有这个:

#include <iostream>
#include <string>
#include <limits>

int main() {
    double maxDbl = std::numeric_limits<double>::max();
    std::string smax = std::to_string(maxDbl);
    std::cout << smax << std::endl;
    
    std::string smax2 = "179769313486231570800000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000.000000";

    double max2 = std::stod(smax2);
    if (max2 == maxDbl) {
       std::cout << smax2 << " is same double as " << smax << std::endl;
    }

    return 0;
}

显示:

179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368.000000
179769313486231570800000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000.000000 is same double as 179769313486231570814527423731704356798070567525844996598917476803157260780028538760589558632766878171540458953514382464234321326889464182768467546703537516986049910576551282076245490090389328944075868508455133942304583236903222948165808559332123348274797826204144723168738177180919299881250404026184124858368.000000

TL/DR:我的意思是,一个大的双精度值当然可以用一个精确的整数表示(根据 IEEE754)。但它确实代表了一半到前一个和一半到下一个之间的所有整数。因此,该范围内的任何整数都可以是双精度数的可接受表示,并且 16 位十进制数字的一个值 四舍五入 应该是可以接受的,但是当前的标准库只允许最大浮点值被截断 16 位十进制数字。但是 VS2013 给出了一个超出范围最大值的数字,无论如何都是错误的。

参考

IEEE floating point on wikipedia

【讨论】:

  • 我不明白你的意思。当然减去 1e+288 不会改变值,因为会涉及舍入。下一个完全可表示的最小数字应该是1.7976931348623155e+308,即DBL_MAX - 2e+292,在我的情况下,DBL_MAX 也是1.7976931348623158e+308。它正好有你提到的16位数字。在 IEEE754 中表示,这应该是 0111111111101111111111111111111111111111111111111111111111111111,因此它应该可以用双精度浮点数表示。为什么要进行四舍五入?
  • @sigy:我已经编辑了我的帖子。我希望它更清楚。
  • 我同意1.7976931348623158e+3081.7976931348623158e+308 - 1e+288 的有效浮点表示。但是,在我看来,VS2013 和 GCC 4.9.2 中 to_string 返回的字符串表示形式不是。而且我看不出有什么理由会发生这种不准确。在 16 位后截断的返回值仍与传递给方法的值不同。 C++ 标准允许这样的不准确吗?如果有,为什么?
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-10-23
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-08-15
  • 2013-05-02
相关资源
最近更新 更多