【问题标题】:Machine learning in Python: scikit-learn / PybrainPython 中的机器学习:scikit-learn / Pybrain
【发布时间】:2016-06-18 12:06:13
【问题描述】:

我阅读了一些教程和介绍,但我不确定我是否掌握了其中的窍门,最重要的是,我不确定我是否完全了解 ML 与 NN。

假设我想指示一个程序(例如使用 scikit-learn),以便它有一些语言字典作为其输入集。例如,我有一个很大的意大利语单词字典,我可以将它作为数组数组输入(数组的每个项目都是一个单词,每个单词都是一个 ascii 值数组,一个用于世界的每个字符):

[
    [112, 105, 122, 122, 97], // pizza
    [109, 097, 109, 109, 97], // mamma
    ...
]  

可能吗/什么是最好的库/如何做到这一点:

  1. 给定一个单词,让程序推断它是否可能是一个意大利语单词,这样“mafia”被识别为潜在的实际意大利语单词,但“Eichhörnchen”不是(它比意大利世界的平均长度更长,它包含在初始集合中找不到像“rnch”这样的序列,它包含“ö”,它是意大利语中不使用的字符)
  2. 根据初始集生成其他(可能的)意大利语单词。例如,“potomo”不是一个实际的意大利语单词,但根据意大利语拼写法,它可能

【问题讨论】:

    标签: python machine-learning scikit-learn neural-network pybrain


    【解决方案1】:

    我认为可以使用朴素贝叶斯分类和KNN。朴素贝叶斯分类被证明可以过滤垃圾邮件,但在此之前你需要一个词库。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-04-23
      • 1970-01-01
      • 2018-08-03
      • 2020-12-10
      • 2017-08-22
      • 2013-01-29
      • 2014-07-13
      • 2019-04-16
      相关资源
      最近更新 更多