【问题标题】:How would you go about writing a Parser similar to Facebook Graph Search您将如何编写类似于 Facebook Graph Search 的 Parser
【发布时间】:2013-08-26 21:37:54
【问题描述】:

我已经阅读了很多文章,这些文章提供了一些关于 Facebook 如何实现其 Graph Search 的背景信息。所有这些似乎只是浏览了他们正在使用的解析器的实际实现细节。

https://www.facebook.com/notes/facebook-engineering/under-the-hood-building-graph-search-beta/10151240856103920

从那个页面:

我们结合了各种解析技术来构建一个子字符串解析器: 假设一个用户输入,比如说,“friends New York”并且我们有 定义了我们的所有潜在页面标题的综合集合 系统可以处理。然后我们的解析器可以准确地生成图 包含用户输入的搜索标题,包括诸如 “住在纽约的朋友”和“去过纽约的朋友” 约克。”如果我们能找到一种方法来适当地对这些建议进行排名 Graph Search 的标题,我们会有一个好的开始。

我真的很想了解解决这个问题的方法。编写这样的系统会使用什么算法/技术?

任何链接也将不胜感激。

【问题讨论】:

  • 我正在搜索一些像你一样的链接(询问)..但找不到太多帮助..

标签: facebook algorithm parsing search


【解决方案1】:

我正在考虑实现类似的东西..想在这里问Q,发现这已经被问过了..

这是我一直在想的开始-

  1. 假设 facebook 搜索引擎“了解”底层数据存储(复杂图)。所以搜索引擎会理解“朋友”、“亲戚”等关系的关键词,不会把它们当成英语中的一个微不足道的词。

  2. 在这种情况下,一个好主意可能是将用户输入(使用客户端 javascript)解析为 JSON 并将其发送到搜索引擎 .. 有几个好处 .. 可以完成解析在客户端,通过不发送不需要的数据来节省网络带宽,服务器端处理解析的输入作为 JSON 更好..etc

  3. 让我们称它为 JSON fbJSON.. 因为除了是 JSON 之外.. 它遵循某种格式.. 您可以为您的格式创建规范.. 这样发送到搜索引擎的 JSON必然包含一些信息..这可以让生活更轻松..就像我们有geoJSON等..

  4. 使用 NLP 程序将用户输入解析为 fbJSON [我还要考虑这个]

这是我正在着手的一种广泛的方法..唯一的瓶颈是第 4 点..因为我在 NLP 方面没有太多经验..

【讨论】:

  • 喜欢这种思维方式,有道理。从那以后,我发现另一个问题stackoverflow.com/questions/14873680/… 有一个很好的答案,它也可以提供帮助。但你似乎比我远得多!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2010-12-09
  • 2016-08-27
  • 1970-01-01
  • 2011-08-06
  • 1970-01-01
  • 2013-01-30
  • 1970-01-01
相关资源
最近更新 更多