【发布时间】:2015-11-29 22:35:06
【问题描述】:
我需要能够测试似乎随机的文件名的文本列表;
例如aggvvcx.com 或 kbzaandc.exe
是否有任何明智/合理的方法可以做到这一点?我唯一的想法是检查元音与辅音的出现比例,但这似乎并不可靠,使用字典也不可靠。
编辑:随机性的定义
我掌握的关于随机性性质的唯一信息是它是一个文件名。也许可以获得一个常见文件名的字典并使用某种模式解析器来确定常见的文件命名模式并在训练后对列表运行它?如果我们考虑多种语言,这显然是一种徒劳的方法,但我只对检查英文文件名感兴趣。
【问题讨论】:
-
我们无法为您定义“随机”的含义。一旦你自己弄清楚了这一点,你就有了问题的答案。
-
您将不得不为“似乎随机”提供更好的定义,因为随机生成的字符串产生“myfile”之类的机会与产生“qzzyei”的机会一样多.这对你来说是随机的。
-
这可能有用:en.wikipedia.org/wiki/Randomness_tests。您可能想尝试在Computer Science 上提问。
-
鉴于 .exe 和 .com 部分,字典似乎是基于字符串的距离函数的最佳选择。除此之外,您可以构建一个已知可执行文件列表并标记任何不属于该列表的内容。
-
以下哪个是随机的(无需谷歌搜索):
nvvsvc.exe、msseces.exe或cvvil.exe。其中两个是windows打包的常用服务,一个是'随机'
标签: c# python algorithm random