【发布时间】:2016-06-18 12:06:13
【问题描述】:
我阅读了一些教程和介绍,但我不确定我是否掌握了其中的窍门,最重要的是,我不确定我是否完全了解 ML 与 NN。
假设我想指示一个程序(例如使用 scikit-learn),以便它有一些语言字典作为其输入集。例如,我有一个很大的意大利语单词字典,我可以将它作为数组数组输入(数组的每个项目都是一个单词,每个单词都是一个 ascii 值数组,一个用于世界的每个字符):
[
[112, 105, 122, 122, 97], // pizza
[109, 097, 109, 109, 97], // mamma
...
]
可能吗/什么是最好的库/如何做到这一点:
- 给定一个单词,让程序推断它是否可能是一个意大利语单词,这样“mafia”被识别为潜在的实际意大利语单词,但“Eichhörnchen”不是(它比意大利世界的平均长度更长,它包含在初始集合中找不到像“rnch”这样的序列,它包含“ö”,它是意大利语中不使用的字符)
- 根据初始集生成其他(可能的)意大利语单词。例如,“potomo”不是一个实际的意大利语单词,但根据意大利语拼写法,它可能是
【问题讨论】:
标签: python machine-learning scikit-learn neural-network pybrain