如何实现一个房地产推荐引擎？答案

【问题标题】：How to implement a real estate recommendation engine?如何实现一个房地产推荐引擎？
【发布时间】：2011-04-05 07:59:56
【问题描述】：

我说的是电影/项目推荐之类的东西，但房地产似乎更棘手。在访问网站并搜索 RE 时，应该向用户提供一些建议。让我们将任务分为两个任务：

a) 用户仍未输入任何个人信息 - 基于项目的推荐 b) 用户已经输入了他/她的详细信息，例如收入、位置等 - 基于项目/用户的推荐

对于任务 a)，我首先想到的是开始对 RE 特征进行建模，但使用一些范围而不是精确值。例如：

因此，拥有范围可以让我们为每个 RE 属性分配一个向量，这将允许我们使用：欧几里德距离、皮尔逊相关性和一些最近邻算法。

请评论我的方法或建议一种新方法。

【问题讨论】：

你为什么对类使用任意基数标签？在我看来，您可以使用 trunc(area/20) 和 trunc(income/10000) 进行更一般的、更自然的映射。强制从中心到数学公式的距离似乎不太直观，尽管我认为可以做到。

【解决方案1】：

如果您已经拥有一个流量足够大的网站，您可以尝试纯粹的协同过滤方法，即查看此属性的人也查看了这些其他属性。您可以在那里使用 Pearson 相关性以获得良好的结果。

2个RE之间的相似度可以定义为

同时查看 RE1 和 RE2 的人数 sim = --------------------------------- 浏览过 1 或两者的人数

当用户查看房产 RE 时，您可以根据与所显示房产的相似度得分对所有其他 RE 房产进行排序，并显示前几项。

您可以在此基础上添加一些明显的过滤器，例如房产的位置、价格范围等。

您还可以按照您的建议定义相似性，并将两者的结果混合在一起，以便在使用纯协同过滤算法的情况下不太可能进入的新 RE 条目中获得良好的表示。

【讨论】：