【发布时间】:2010-10-16 03:09:39
【问题描述】:
我被要求制作一个软件,该软件将根据字母 frequencies 加密和解密“普通英语”文本。
问题是我在哪里可以找到一些与官方频率匹配的文本样本?
到目前为止,我已经尝试过"War and Peace" by Lev Tolstoy,但效果不佳..
LE:我不仅需要一个单词列表,我还需要一个文本样本来进行一些处理。
LE2:目标是在 2000 个字符的长文本中从 26 中猜测 20。
【问题讨论】:
-
为了将来参考,这个词是加密。
-
距离《战争与和平》还有多远?
-
IN、SHR、CUMW 错误,即使在 2.6MB .txt 文件中也是如此……我希望文本的较小部分出现错误的频率……但不是整本书。
-
如果我将文件剪切到 ~100KB,我可以匹配大约 6-10 个字母,仅此而已。
-
目标是在 2000 个字符的长文本中从 26 中猜测 20。
标签: cryptography frequency-analysis frequency-distribution