【发布时间】:2011-04-05 07:59:56
【问题描述】:
我说的是电影/项目推荐之类的东西,但房地产似乎更棘手。在访问网站并搜索 RE 时,应该向用户提供一些建议。让我们将任务分为两个任务:
a) 用户仍未输入任何个人信息 - 基于项目的推荐 b) 用户已经输入了他/她的详细信息,例如收入、位置等 - 基于项目/用户的推荐
对于任务 a),我首先想到的是开始对 RE 特征进行建模,但使用一些范围而不是精确值。例如:
-
面积(平方米)
- 40 - 50 我们可以将其标记为“1”
- 50 - 70 是“2”
- 等等...
-
价格:
- 20 - 30,000 欧元将被标记为 1
- 30 - 40 将是 2
- 等等...
-
靠近市中心:
- 1 代表 RE 位于市中心
- 2 区为 2 或距中心最多 2/3 公里
- 3 区 3 或距中心 7 公里
因此,拥有范围可以让我们为每个 RE 属性分配一个向量,这将允许我们使用:欧几里德距离、皮尔逊相关性和一些最近邻算法。
请评论我的方法或建议一种新方法。
【问题讨论】:
-
你为什么对类使用任意基数标签?在我看来,您可以使用 trunc(area/20) 和 trunc(income/10000) 进行更一般的、更自然的映射。强制从中心到数学公式的距离似乎不太直观,尽管我认为可以做到。
标签: algorithm machine-learning recommendation-engine