【发布时间】:2011-11-17 00:36:04
【问题描述】:
我有一个问题,不知道必须应用哪种算法。 我正在考虑在案例二中应用集群,但不知道案例一:
我有 50 万份信用卡活动文件。每个文档定义明确,每行包含 1 个事务。日期、金额、零售商名称和零售商的简短 5-20 字描述。 样本: 2004-11-47,$500,亚马逊,一家提供书籍、硬件、音乐等商品和服务的在线零售商。 问题: 1. 如果没有预先定义的类别,如何对每个条目进行分类。 2. 如果给你预先定义的类别,如“餐厅”、“娱乐”等,你会怎么做?
【问题讨论】:
-
这个项目的目的是什么?
标签: nlp data-mining text-processing