【问题标题】:EBCDIC to ASCII conversion. Out of bound error. In C#EBCDIC 到 ASCII 的转换。越界错误。在 C# 中
【发布时间】:2010-12-28 23:53:47
【问题描述】:

我尝试使用这个通用转换顺序(如下所示)在 C# 中创建一个 EBCDIC 到 ASCII 对流器。基本上,程序使用以下顺序从 ASCII 转换为等效整数,然后从那里转换为 EDCDIC。

现在,当我尝试在 C# 中编译它并尝试提供 EBCDIC 字符串(从另一台计算机的另一个文件中获取)时,它显示某些 EBCDIC 字符的“超出范围”异常。为什么会这样??是关于格式化吗??还是 C# ??还是窗户?

额外:我尝试使用循环从 0..255 个数字打印出所有 ASCII 和 EBCDIC 字符,但仍然没有显示许多 EBCDIC 字符。我是否缺少任何标准?

整个代码如下:

public string convertFromEBCDICtoASCII(string inputEBCDICString, int initialPos, int endPos)
    {
        string inputSubString = inputEBCDICString.Substring(initialPos, endPos);
        int[] e2a = new int[256]{
                                    0, 1, 2, 3,156, 9,134,127,151,141,142, 11, 12, 13, 14, 15,
                                    16, 17, 18, 19,157,133, 8,135, 24, 25,146,143, 28, 29, 30, 31,
                                    128,129,130,131,132, 10, 23, 27,136,137,138,139,140, 5, 6, 7,
                                    144,145, 22,147,148,149,150, 4,152,153,154,155, 20, 21,158, 26,
                                    32,160,161,162,163,164,165,166,167,168, 91, 46, 60, 40, 43, 33,
                                    38,169,170,171,172,173,174,175,176,177, 93, 36, 42, 41, 59, 94,
                                    45, 47,178,179,180,181,182,183,184,185,124, 44, 37, 95, 62, 63,
                                    186,187,188,189,190,191,192,193,194, 96, 58, 35, 64, 39, 61, 34,
                                    195, 97, 98, 99,100,101,102,103,104,105,196,197,198,199,200,201,
                                    202,106,107,108,109,110,111,112,113,114,203,204,205,206,207,208,
                                    209,126,115,116,117,118,119,120,121,122,210,211,212,213,214,215,
                                    216,217,218,219,220,221,222,223,224,225,226,227,228,229,230,231,
                                    123, 65, 66, 67, 68, 69, 70, 71, 72, 73,232,233,234,235,236,237,
                                    125, 74, 75, 76, 77, 78, 79, 80, 81, 82,238,239,240,241,242,243,
                                    92,159, 83, 84, 85, 86, 87, 88, 89, 90,244,245,246,247,248,249,
                                    48, 49, 50, 51, 52, 53, 54, 55, 56, 57,250,251,252,253,254,255
                            };
        char chrItem = Convert.ToChar("0");
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < inputSubString.Length; i++)
        {
            try
            {
                chrItem = Convert.ToChar(inputSubString.Substring(i, 1));
                sb.Append(Convert.ToChar(e2a[(int)chrItem]));
                sb.Append((int)chrItem);
                sb.Append((int)00);
            }
            catch (Exception ex)
            {
                Console.WriteLine("//" + ex.Message);
                return string.Empty;
            }
        }
        string result = sb.ToString();
        sb = null;
        return result;
    }

【问题讨论】:

  • 如果您可以发布基于您的数组执行转换的代码,我们可以尝试获取有关您的问题的更多信息。
  • 已经发布了整个代码。谢谢
  • 您从哪里获得 EBCDIC 到 ASCII 表?
  • 为什么要创建一个查找表并搞乱循环? C# 支持开箱即用的 EBCDIC - 请参阅@Frank 的回答

标签: c# ascii ebcdic


【解决方案1】:

您没有显示生成错误的代码,但如果您使用字符作为数组的索引,您应该知道 C# 使用 Unicode(2 字节)字符。字符代码可以一直到 64k。这肯定会超出您的数组的范围。

【讨论】:

  • 非常感谢您的帮助。这似乎是问题所在。
  • 如果对您有帮助,请将我的回复标记为答案。谢谢。
  • Unicode 字符不是 2 字节。它们是 21 位(如果您愿意,也可以是 20.1 位),并且有很多表示形式。我认为您的意思是说 C#“字符”实际上是 UTF-16 代码单元。
【解决方案2】:

完全不清楚您在做什么,因为您发布的只是数组。

不过,我有一个 EBCDIC encoding implementation 你可能想使用。它不能处理“转移”,但它普通System.Text.Encoding 类的子类,因此您可以将它与StreamReader 之类的东西一起使用。哦,还有各种不同的口味——基本上都在this directory 中列出。您需要找到适合您的。

【讨论】:

    【解决方案3】:
      string convertFromEBCDICtoASCII(string inputEBCDICString, ...)
    

    你一开始就走错了路。您无法将包含 EBCDIC 的文件读入字符串。 .NET 文本文件阅读器将假定文件中的文本以某种方式编码。和 StreamReader 一样,它默认使用 utf-8。这不能在 EBCDIC 文件上正常工作,它会错误解释某些字符并将它们转换为 >= 256 的 Unicode 代码点。这会破坏您的数组索引代码。

    您必须将输入参数更改为 byte[]。使用 FileStream 或 File.ReadAllBytes() 读取文件。

    下一个问题是您的表对 .NET 字符串无效,它们以 utf-16 编码。例如,128 不是 ASCII 代码,也不是有效的 Unicode 代码点。不确定使用什么代码页来构建表,可能是代码页 1252。替换字节后,接下来您必须使用 Encoding.GetString() 将该代码页转换为 Unicode。

    要以另一种方式杀死这条巨龙,请注意 Encoding 类已经支持 EBCDIC 代码页。查看 Encoding.GetEncodings() 方法的文档。您必须了解 IBM 代码页。您可以将正确的编码传递给 StreamReader(String, Encoding) 构造函数,而无需编写任何代码。

    【讨论】:

      【解决方案4】:

      我就是这样做的

          #region public static byte[] ConvertAsciiToEbcdic(byte[] asciiData)
          public static byte[] ConvertAsciiToEbcdic(byte[] asciiData)
          {
      
              // Create two different encodings.
              Encoding ascii = Encoding.ASCII;
              Encoding ebcdic = Encoding.GetEncoding("IBM037");
      
              //Retutn Ebcdic Data
              return Encoding.Convert(ascii, ebcdic, asciiData);
      
          }
          #endregion
      
          #region public static byte[] ConvertEbcdicToAscii(byte[] ebcdicData)
          public static byte[] ConvertEbcdicToAscii(byte[] ebcdicData)
          {
              // Create two different encodings.
              Encoding ascii = Encoding.ASCII;
              Encoding ebcdic = Encoding.GetEncoding("IBM037");
      
              //Retutn Ascii Data
              return Encoding.Convert(ebcdic, ascii, ebcdicData);
          }
          #endregion
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2022-12-13
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多