【发布时间】:2018-05-10 04:16:57
【问题描述】:
我在 csv 文件中有以下格式的数据
Name Power Money
Jon Red 30
George blue 20
Tom Red 40
Bob purple 10
我将“jon”、“red”和“30”等值视为输入。每个输入都作为一个标签。例如输入 [jon,george,tom,bob] 具有标签“name”。输入 [red,blue, Purple] 有标签“power”。这基本上是我拥有训练数据的方式。我有一堆值,每个值都映射到一个标签。
现在我想使用 svm 根据我的训练数据训练一个模型,以便在给定新输入的情况下准确识别它的正确标签是什么。因此,例如,如果提供的输入是 "444" ,则模型应该足够聪明,可以将其归类为 "Money" 标签。
我已经安装了 py 并且还安装了sklearn。我也完成了以下tutorial。我只是不确定如何准备输入数据来训练模型。
另外,我是机器学习的新手,如果我说了一些听起来错误或奇怪的话,请指出,因为我很乐意学习正确的。
【问题讨论】:
-
正如您所解释的,最好只搜索数据中的类别,而不是对其进行机器学习。此外,当相同的字符串出现在两个或多个类别中时会发生什么?就像紫罗兰一样,它可能是一种颜色或名称。
-
您应该更新您的问题。现在看起来你有 6 个类,它是一个简单的 hashmap 查找而不是 ML 问题。尤其是没有MWE,很难给你有用的建议。
-
@VivekKumar 是的,我明白你的意思。我已经编辑了这个问题,请告诉我这是否更有意义。
-
@jonnybazookatone 感谢您对我更新问题的宝贵反馈,如果这更有意义或需要更多详细信息,请告诉我。
-
仍然不相信这需要机器学习。无论如何,请在进一步评论之前添加所有可能列的示例。
标签: machine-learning scikit-learn svm supervised-learning