【问题标题】:.Net 8-bit Encoding.Net 8 位编码
【发布时间】:2008-09-21 17:21:19
【问题描述】:

我正在研究串行端口,以 8 位数据向某些硬件发送和接收数据。我想将其存储为字符串以方便比较,预设数据以字符串或十六进制格式存储在xml文件中。我发现只有在使用 Encoding.Default (即 ANSI 编码)时,8 位数据才能正确转换且易于可逆。 ASCII 编码只适用于 7 位数据,而 UTF8 或 UTF7 也不能很好地工作,因为我使用的是 1-255 中的一些字符。 Encoding.Default 会很好,但我在 MSDN 上读到它依赖于操作系统代码页设置,这意味着它在配置的不同代码页上可能表现不同。我使用编码广泛使用 GetBytes() 和 GetString,但希望有一种故障安全且可移植的方法,该方法在任何配置下始终有效。对此有何想法或更好的建议?

【问题讨论】:

    标签: .net encoding


    【解决方案1】:

    Latin-1 aka ISO-8859-1 aka codepage 28591 是这种情况下有用的代码页,因为它映射 128-255 范围内的值不变。以下是可以互换的:

    Encoding.GetEncoding(28591)
    Encoding.GetEncoding("Latin1")
    Encoding.GetEncoding("iso-8859-1")
    

    以下代码说明了这样一个事实,即对于 Latin1,与 Encoding.Default 不同,0-255 范围内的所有字符都被原封不动地映射:

    static void Main(string[] args)
    {
    
        Console.WriteLine("Test Default Encoding returned {0}", TestEncoding(Encoding.Default));
        Console.WriteLine("Test Latin1 Encoding returned {0}", TestEncoding(Encoding.GetEncoding("Latin1")));
        Console.ReadLine();
        return;
    }
    
    private static bool CompareBytes(char[] chars, byte[] bytes)
    {
        bool result = true;
        if (chars.Length != bytes.Length)
        {
            Console.WriteLine("Length mismatch {0} bytes and {1} chars" + bytes.Length, chars.Length);
            return false;
        }
        for (int i = 0; i < chars.Length; i++)
        {
            int charValue = (int)chars[i];
            if (charValue != (int)bytes[i])
            {
                Console.WriteLine("Byte at index {0} value {1:X4} does not match char {2:X4}", i, (int) bytes[i], charValue);
                result = false;
            }
        }
        return result;
    }
    private static bool TestEncoding(Encoding encoding)
    {
        byte[] inputBytes = new byte[256];
        for (int i = 0; i < 256; i++)
        {
            inputBytes[i] = (byte) i;
        }
    
        char[] outputChars = encoding.GetChars(inputBytes);
        Console.WriteLine("Comparing input bytes and output chars");
        if (!CompareBytes(outputChars, inputBytes)) return false;
    
        byte[] outputBytes = encoding.GetBytes(outputChars);
        Console.WriteLine("Comparing output bytes and output chars");
        if (!CompareBytes(outputChars, outputBytes)) return false;
    
        return true;
    }
    

    【讨论】:

    • 我认为你的想法最接近。我先试试看。
    【解决方案2】:

    为什么不直接使用字节数组呢?它不会有您在使用文本方法时可能遇到的任何编码问题。

    【讨论】:

    • 有时使用串行 i/o,您希望发送散布有控制字符的文本字符串。如果您使用字符串,则更易于阅读。
    • @Joe:您始终可以使用 ASCIIEncoding 来检索字符串以获取一系列字节。
    • 将此与 Latin-1 结合使用
    【解决方案3】:

    我认为您应该改用字节数组。为了比较,您可以使用以下方法:

    static bool CompareRange(byte[] a, byte[] b, int index, int count)
    {
        bool res = true;
        for(int i = index; i < index + count; i++)
        {
            res &= a[i] == b[i];
        }
        return res;
    }
    

    【讨论】:

    • 我需要使用字符串,它是 IndexOf、Replace、Split 和 SubString 等内置函数。类似于 joe 对 lassevk 的回答的评论
    【解决方案4】:

    使用适用于 Windows-1255 的希伯来语代码页。它的 8 位。
    编码 enc = Encoding.GetEncoding("windows-1255");

    当您写“1-255”时,我误会了您,以为您在哪里引用代码页 1255 中的字符。

    【讨论】:

      【解决方案5】:

      您可以使用 base64 编码将字节转换为字符串并返回。这样代码页或奇怪的字符都没有问题,而且它比十六进制更节省空间。

      byte[] toEncode; 
      string encoded = System.Convert.ToBase64String(toEncode);
      

      【讨论】:

      • 因为 OP 想要二进制数据的文本表示,它易于转换并且可以放在 XML 中。 Base64 编码符合要求。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-10-24
      • 2010-12-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多