【问题标题】:Reverse engineer a binary dictionary file to extract strings逆向工程二进制字典文件以提取字符串
【发布时间】:2012-05-31 22:09:59
【问题描述】:

我有一个约 600MB 的 .DAT 文件,其中包含一本意大利词典(带有定义的重音词)。

我想从这个文件中提取所有的字符串(一个包含字符串和脏头/二进制数据的原始转储就可以了,只要我能读懂单词和定义)。

所以我的问题是: 是否有软件可以自动执行此操作?

我会告诉它: '我知道这个文件包含字符串“TREE”、“DOG”、“CAT”、“COLLISION”......现在使用一些蛮力、统计分析或任何方法来尝试找出这些字符串是如何编码的'

我想提两件事:

  • 我是一名软件开发人员,但在逆向工程、十六进制编辑等方面完全没有经验或知识...
  • 我不想花几个小时阅读逆向工程教程和使用许多软件进行反复试验。如果我不能以简单的方式成功提取我需要的东西,我将放弃这项任务。

我意识到这个任务可能无法简单地执行(例如,如果文本是加密的),我只是想用最好的工具尝试一下。

【问题讨论】:

    标签: reverse-engineering


    【解决方案1】:

    似乎不存在这样的自动化工具,如果存在,它只适用于非常小的输入文件集。

    我终于找到了解决问题的方法。

    我有一个 EXE 程序,可以浏览字典并显示单词的定义。

    使用 AutoHotkey,我编写了一个相对简单的脚本,它从 400k 单词的输入列表中搜索每个单词的定义,将其复制到剪贴板,然后将其粘贴到另一个输出文本文件中。

    我必须在击键、窗口切换等之间插入一些Sleep 语句以使脚本稳定。 “解析”整个字典的预计时间:20 天 :)

    【讨论】:

      猜你喜欢
      • 2012-07-21
      • 2012-09-05
      • 2011-07-14
      • 2010-12-06
      • 2011-09-27
      • 2017-10-04
      • 1970-01-01
      • 2012-01-31
      • 1970-01-01
      相关资源
      最近更新 更多