【发布时间】:2011-02-19 05:40:42
【问题描述】:
问题:给定一组手工分类的字符串(或一组有序的字符串向量)生成一个分类函数来分类更多输入。就我而言,这些数据(或大部分数据)不是自然语言。
问题:是否有任何工具可以做到这一点?我正在考虑某种合理的优化、下载、安装和运行的东西,而不是一些图书馆或脆弱的学术程序。
(请不要拘泥于细节,因为真实的细节会限制对不太常用的回复的回答,并且处于保密协议之下。)
作为我正在查看的示例;我要过滤的输入是从日志中提取的计算机生成的状态字符串。根据需要通知谁或需要采取什么行动来过滤错误消息(例如)。
【问题讨论】:
-
您可能想多说一点关于您要分类的字符串。例如,它们是否由自然语言数据(例如电子邮件或其他文档)组成?
-
您是否有权访问源代码,即您是否拥有所有可能获得的状态字符串的列表?
-
错误信息就是一个例子。 OTOH 我无权访问生成输入的东西。
标签: code-generation machine-learning nlp classification decision-tree