【问题标题】:How to implement a real estate recommendation engine?如何实现一个房地产推荐引擎?
【发布时间】:2011-04-05 07:59:56
【问题描述】:

我说的是电影/项目推荐之类的东西,但房地产似乎更棘手。在访问网站并搜索 RE 时,应该向用户提供一些建议。让我们将任务分为两个任务:

a) 用户仍未输入任何个人信息 - 基于项目的推荐 b) 用户已经输入了他/她的详细信息,例如收入、位置等 - 基于项目/用户的推荐

对于任务 a),我首先想到的是开始对 RE 特征进行建模,但使用一些范围而不是精确值。例如:

  1. 面积(平方米)

    • 40 - 50 我们可以将其标记为“1”
    • 50 - 70 是“2”
    • 等等...
  2. 价格:

    • 20 - 30,000 欧元将被标记为 1
    • 30 - 40 将是 2
    • 等等...
  3. 靠近市中心:

    • 1 代表 RE 位于市中心
    • 2 区为 2 或距中心最多 2/3 公里
    • 3 区 3 或距中心 7 公里

因此,拥有范围可以让我们为每个 RE 属性分配一个向量,这将允许我们使用:欧几里德距离、皮尔逊相关性和一些最近邻算法。

请评论我的方法或建议一种新方法。

【问题讨论】:

  • 你为什么对类使用任意基数标签?在我看来,您可以使用 trunc(area/20) 和 trunc(income/10000) 进行更一般的、更自然的映射。强制从中心到数学公式的距离似乎不太直观,尽管我认为可以做到。

标签: algorithm machine-learning recommendation-engine


【解决方案1】:

如果您已经拥有一个流量足够大的网站,您可以尝试纯粹的协同过滤方法,即查看此属性的人也查看了这些其他属性。您可以在那里使用 Pearson 相关性以获得良好的结果。

2个RE之间的相似度可以定义为

同时查看 RE1 和 RE2 的人数 sim = --------------------------------- 浏览过 1 或两者的人数

当用户查看房产 RE 时,您可以根据与所显示房产的相似度得分对所有其他 RE 房产进行排序,并显示前几项。

您可以在此基础上添加一些明显的过滤器,例如房产的位置、价格范围等。

您还可以按照您的建议定义相似性,并将两者的结果混合在一起,以便在使用纯协同过滤算法的情况下不太可能进入的新 RE 条目中获得良好的表示。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-01-09
    • 2010-09-25
    • 2019-09-25
    • 2011-02-11
    • 2017-10-26
    • 1970-01-01
    相关资源
    最近更新 更多