【问题标题】:translate data file with odd Hebrew encoding用奇怪的希伯来语编码翻译数据文件
【发布时间】:2010-10-21 12:21:20
【问题描述】:

我有一个二进制数据文件,它是一个相对古老的程序使用的格式,我正在尝试将其转换为正常的东西。在十六进制编辑器的帮助下,我基本上已经确定了文件格式,除了它包含带有奇怪编码的希伯来字符。

所有字符都是 8 位。 “标准”27 个辅音(包括“最终”辅音)从十六进制 80 到 9A。然后有些元音似乎开始于十六进制 9B 左右(我猜是在标准辅音结束之后)。然后是似乎从十六进制 E0 开始的“点”辅音。

如果我没记错的话,我认为这是某种 DOS 编码。这是什么编码,我应该将它翻译成什么编码,以便以色列的用户能够最轻松地在 Microsoft Word 中打开它?有什么工具可以用来翻译吗?

【问题讨论】:

    标签: encoding dos reverse-engineering file-format hebrew


    【解决方案1】:

    80 到 9A 似乎与 CP862 中的代码点匹配,但我找不到与元音代码点匹配的任何内容。我认为您应该做的只是制作自定义映射to Unicode 并以 UTF-8 或 UTF-16LE 纯文本文件生成输出。如果您添加 BOM(字节顺序标记),记事本和/或 Word 应该能够毫无问题地读取它。我可能会编写一个小的 Python 脚本,但用任何其他语言应该都不难。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-11-30
      • 2015-07-16
      • 1970-01-01
      • 1970-01-01
      • 2023-04-08
      • 2016-07-07
      • 1970-01-01
      相关资源
      最近更新 更多