【问题标题】:Parse decimal number without loosing significant digits解析十进制数而不丢失有效数字
【发布时间】:2015-12-27 22:48:42
【问题描述】:

我需要将用户输入解析为数字并将其存储在decimal 变量中。

不接受任何不能用decimal 值正确表示的用户输入对我来说很重要。

这适用于非常大(或非常小)的数字,因为在这些情况下 Parse 方法会抛出 OverflowException

但是,当一个数字的有效数字过多时,Parse 方法将静默返回一个截断(或四舍五入?)的值。

例如,解析1.23456789123456789123456789123(30 个有效数字)会得到一个等于1.2345678912345678912345678912(29 个有效数字)的值。

根据specificationdecimal 值的精度为 28-29 位有效数字。

但是,我需要能够检测(并拒绝)在解析时将被截断的数字,因为在我的情况下丢失有效数字是不可接受的。

最好的方法是什么?


请注意,通过字符串比较进行预解析或后验证并不是一个简单的方法,因为我需要支持各种特定于文化的输入和各种number styles(空格、千位分隔符、括号, 指数语法等)。

因此,我正在寻找一种解决方案,而无需复制 .NET 提供的解析代码。


我目前正在使用此解决方法来检测具有 28 位或更多有效数字的输入。虽然这有效,但它有效地将所有输入限制为最多 27 个有效数字(而不是 28-29):

/// <summary>
///     Determines whether the specified value has 28 or more significant digits, 
///     in which case it must be rejected since it may have been truncated when 
///     we parsed it.
/// </summary>
static bool MayHaveBeenTruncated(decimal value)
{
    const string format = "#.###########################e0";
    string str = value.ToString(format, CultureInfo.InvariantCulture);
    return (str.LastIndexOf('e') - str.IndexOf('.')) > 27;
}

【问题讨论】:

  • 您可以尝试将小数转换为字符串并与原来的比较。
  • @IllidanS4:但这将拒绝所有未根据我用于将十进制值格式化为字符串的任何格式进行格式化的输入。
  • 是的。如果小于 28 或 29,您可以牺牲一位十进制数字并计算转换字符串中的位数。如果是这样,一些数字可能已经丢失,尽管它可能会拒绝具有 29 位有效数字的输入。

标签: c# .net parsing numbers


【解决方案1】:

首先让我声明没有“官方”解决方案。通常我不会依赖内部实现,所以我为您提供以下内容只是因为您说解决这个问题对您非常重要。

如果您查看参考源,您会发现所有解析方法都在(不幸的是内部)System.Number 类中实现。进一步调查,decimal相关的方法是TryParseDecimalParseDecimal,它们都使用这样的东西

byte* buffer = stackalloc byte[NumberBuffer.NumberBufferBytes];
var number = new NumberBuffer(buffer);
if (TryStringToNumber(s, styles, ref number, numfmt, true))
{
   // other stuff
}                        

其中NumberBuffer 是另一个内部struct。关键是整个解析都发生在TryStringToNumber 方法内部,结果用于生成结果。我们感兴趣的是一个名为precisionNumberBuffer 字段,它由上述方法填充。

考虑到所有这些,我们可以在调用基本十进制方法后生成一个类似的方法来提取精度,以确保在我们进行后处理之前进行正常的验证/异常。所以方法是这样的

static unsafe bool GetPrecision(string s, NumberStyles style, NumberFormatInfo numfmt)
{
    byte* buffer = stackalloc byte[Number.NumberBuffer.NumberBufferBytes];
    var number = new NumberBuffer(buffer);
    TryStringToNumber(s, styles, ref number, numfmt, true);
    return number.precision;
}

但请记住,这些类型及其方法都是内部的,因此很难应用基于普通反射、委托或Expression 的技术。幸运的是,使用System.Reflection.Emit 编写这样的方法并不难。完整实现如下

public static class DecimalUtils
{
    public static decimal ParseExact(string s, NumberStyles style = NumberStyles.Number, IFormatProvider provider = null)
    {
        // NOTE: Always call base method first 
        var value = decimal.Parse(s, style, provider);
        if (!IsValidPrecision(s, style, provider))
            throw new InvalidCastException(); // TODO: throw appropriate exception
        return value;
    }

    public static bool TryParseExact(string s, out decimal result, NumberStyles style = NumberStyles.Number, IFormatProvider provider = null)
    {
        // NOTE: Always call base method first 
        return decimal.TryParse(s, style, provider, out result) && !IsValidPrecision(s, style, provider);
    }

    static bool IsValidPrecision(string s, NumberStyles style, IFormatProvider provider)
    {
        var precision = GetPrecision(s, style, NumberFormatInfo.GetInstance(provider));
        return precision <= 29;
    }

    static readonly Func<string, NumberStyles, NumberFormatInfo, int> GetPrecision = BuildGetPrecisionFunc();
    static Func<string, NumberStyles, NumberFormatInfo, int> BuildGetPrecisionFunc()
    {
        const BindingFlags Flags = BindingFlags.Public | BindingFlags.NonPublic;
        const BindingFlags InstanceFlags = Flags | BindingFlags.Instance;
        const BindingFlags StaticFlags = Flags | BindingFlags.Static;

        var numberType = typeof(decimal).Assembly.GetType("System.Number");
        var numberBufferType = numberType.GetNestedType("NumberBuffer", Flags);

        var method = new DynamicMethod("GetPrecision", typeof(int),
            new[] { typeof(string), typeof(NumberStyles), typeof(NumberFormatInfo) },
            typeof(DecimalUtils), true);

        var body = method.GetILGenerator();
        // byte* buffer = stackalloc byte[Number.NumberBuffer.NumberBufferBytes];
        var buffer = body.DeclareLocal(typeof(byte*));
        body.Emit(OpCodes.Ldsfld, numberBufferType.GetField("NumberBufferBytes", StaticFlags));
        body.Emit(OpCodes.Localloc);
        body.Emit(OpCodes.Stloc, buffer.LocalIndex);
        // var number = new Number.NumberBuffer(buffer);
        var number = body.DeclareLocal(numberBufferType);
        body.Emit(OpCodes.Ldloca_S, number.LocalIndex);
        body.Emit(OpCodes.Ldloc, buffer.LocalIndex);
        body.Emit(OpCodes.Call, numberBufferType.GetConstructor(InstanceFlags, null,
            new[] { typeof(byte*) }, null));
        // Number.TryStringToNumber(value, options, ref number, numfmt, true);
        body.Emit(OpCodes.Ldarg_0);
        body.Emit(OpCodes.Ldarg_1);
        body.Emit(OpCodes.Ldloca_S, number.LocalIndex);
        body.Emit(OpCodes.Ldarg_2);
        body.Emit(OpCodes.Ldc_I4_1);
        body.Emit(OpCodes.Call, numberType.GetMethod("TryStringToNumber", StaticFlags, null,
            new[] { typeof(string), typeof(NumberStyles), numberBufferType.MakeByRefType(), typeof(NumberFormatInfo), typeof(bool) }, null));
        body.Emit(OpCodes.Pop);
        // return number.precision;
        body.Emit(OpCodes.Ldloca_S, number.LocalIndex);
        body.Emit(OpCodes.Ldfld, numberBufferType.GetField("precision", InstanceFlags));
        body.Emit(OpCodes.Ret);

        return (Func<string, NumberStyles, NumberFormatInfo, int>)method.CreateDelegate(typeof(Func<string, NumberStyles, NumberFormatInfo, int>));
    }
}

使用它需要您自担风险:)

【讨论】:

  • 出色的工作。谢谢!虽然,我想我仍然必须使用我的ToString('#.#####...") 解决方法来确保不会丢失任何有效数字。您的代码始终测试 29 或更少,但小数的精度为 29 28。
  • 是的,这是文档中不清楚的地方之一。例如,Remarks here 说“比例因子是隐含的数字 10,提升到从 0 到 28 的指数”。所以可能支票应该只是28?我知道您指的是“十进制(C# 参考)”,但我从未见过小数点后 29 位的十进制示例,对吗?尝试decimal d = 0.00000000000000000000000000001m; 得到零。
【解决方案2】:

假设输入是一个字符串并且它已经被验证为数字,你可以使用 String.Split:

text = text.Trim().Replace(",", "");
bool neg = text.Contains("-");
if (neg) text = text.Replace("-", "");
while (text.Substring(0, 1) == 0 && text.Substring(0, 2) != "0." && text != "0")
    text = text.Substring(1);
if (text.Contains("."))
{
    while (text.Substring(text.Length - 1) == "0")
        text = text.Substring(0, text.Length - 1);
}
if (text.Split(".")[0].Length + text.Split(".")[1].Length + (neg ? 1 : 0) <= 29)
    valid = true;

您可以覆盖或替换 Parse 并包含此检查。

【讨论】:

  • 这可能适用于简单的输入。但不处理前导/尾随符号/空格/零,也不考虑指数语法。
  • 是的,但这可以在前面的解析检查中解决。然后将拆分值转换回小数,以供 OP 使用。
  • 我担心这种方法会导致非常复杂的解析检查(考虑到文化设置、千位分隔符等)。我正在寻找更清洁的解决方案(如果可能),
  • 可以使用 Trim() 处理空白,并在循环中使用前导零,符号也可以轻松处理。至于指数语法,我认为允许数据输入是不正常的,但是您可以添加逻辑来处理它,但我可能只是不允许它。
  • 我需要接受所有支持的文化中的所有数字样式,并拒绝所有不能表示为十进制值的数字。
【解决方案3】:

问题是在您进行对话时会进行四舍五入,即如果小数超过 28 位,Decimal myNumber = Decimal.Parse(myInput) 将始终返回一个四舍五入的数字。

您也不想创建一个大解析器,所以我要做的是将输入字符串值与新的十进制值作为字符串进行比较:

//This is the string input from the user
string myInput = "1.23456789123456789123456789123";

//This is the decimal conversation in your application
Decimal myDecimal = Decimal.Parse(myInput);

//This is the check to see if the input string value from the user is the same 
//after we parsed it to a decimal value. Now we need to parse it back to a string to verify
//the two different string values:
if(myInput.CompareTo(myDecimal.ToString()) == 0)
    Console.WriteLine("EQUAL: Have NOT been rounded!");
else
    Console.WriteLine("NOT EQUAL: Have been rounded!");

这样 C# 将处理所有数字内容,您只需快速检查。

【讨论】:

  • 谢谢,但这将拒绝所有未按照默认十进制字符串格式格式化的输入。
  • 但是我需要确切地知道该用户使用了哪种样式。
  • 你能举一些关于不同输入的例子吗? 1.1234'1234? 1.1234,1234?我在这里看到的问题是,也许您应该尝试在 User Application 端解决这个问题,即确保输入“好数据”。
  • 不是这个问题是关于找出解析数字是否会导致有效数字丢失。
【解决方案4】:

你应该看看BigRational impelmentation。它不是(还不是?).Net 框架的一部分,但它与 BigInteger 类等效,并提供了一个 TryParse 方法。这样,您应该能够比较您解析的 BigRational 是否等于解析的小数。

【讨论】:

  • 这听起来很有希望。但是,除了BigInteger 提供的实现之外,我找不到TryParse 实现。
  • Transit C# 实现的那个怎么样:github.com/NForza/transit-csharp/blob/master/src/Transit/…
  • 不幸的是,解析函数不支持任何 .NET 数字样式,这在我的情况下是必需的。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-11-16
  • 2022-06-10
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-03-15
相关资源
最近更新 更多