【发布时间】:2015-09-05 07:21:16
【问题描述】:
我从我的客户那里得到了一个新任务(不是传统的),它是关于机器学习的。 因为除了一些数据挖掘的小东西,我从来没有接触过“机器学习”,所以我需要你的帮助。
我的任务是根据性别(产品所属的人)、年龄组等对任何购物网站上出现的产品进行分类,我们可以拥有的训练数据是产品的标题、关键字(在 html 中可用产品页面)和产品描述。
我做了很多研发,我找到了返回产品图像详细信息但没有完全满足需求的 Image Recog APIs(cloudsight,vufind),使用了谷歌建议查询,搜索了许多机器学习算法,最后。 ..
我开始了解“决策树学习算法”,但不知道它如何适用于我的问题。 我尝试了“PlayingTennis”数据集,但不知道该怎么做。
你能给我一些方向,从哪里开始这个旅程?我应该专注于决策树学习算法还是您建议我应该专注于根据上下文对产品进行分类的其他算法?
如果你说,我会详细分享我搜索的内容以解决我的问题。
【问题讨论】:
-
您希望将产品分类到哪些类别?产品页面有哪些关键词?
-
我想根据性别对它们进行分类,即分析产品标题/描述,我想评估该产品是男性还是女性。
-
你有训练数据集吗?如果是,该集合中的训练实例是否标有预期性别?例如。如果你的数据集中有一个产品,你知道这个产品是男性还是女性?
-
根据人类的感觉,我知道这个产品是男女用的,比如bloomingdales的“John Varvatos USA Peace Polo - Slim Fit”衬衫,是男装的,我不知道计算机。以下是该产品的链接,www1.bloomingdales.com/shop/product/… 现在,我想要计算机使用链接上的描述和其他数据来确定该产品所属的性别。我正在寻找方法,但没有成功。
标签: algorithm machine-learning classification