【发布时间】:2011-03-23 16:13:59
【问题描述】:
我有以下文章列表: 标题、副标题和正文。
现在我需要解析所有这些文章,并根据它们可能的关键字将它们分组到不同的上下文类别或子类别中。
例如如果文章可能与跑车相关,那么文章将与汽车或/和车辆上下文相关联
现在我明白这是一片广阔的海洋,但这也是我提出这个问题的原因。因为解决方案的海洋对我来说可能太大了,我很可能会迷路并采用一些糟糕的解决方案。
可能有一些我不知道的流行和标准化的方法,如果有人指出我正确的方向,那将非常有用。
帮助会很棒。 =)
【问题讨论】:
标签: python data-mining nlp