【问题标题】:Searching across multiple languages -- how to?跨多种语言搜索——如何?
【发布时间】:2017-04-05 01:18:04
【问题描述】:

TLDR:我想在我的网站 ala Pinterest 上构建多语言搜索,我该怎么做?

我正在创建一个网站,人们可以在其中发布获取用户输入的元数据的内容。然后,人们可以通过查看、喜欢、评论、分享到社交媒体来与内容互动。此外,内容发现主要是通过搜索完成的。

我不想在我的网站上创建地理边界。我希望说任何语言的人都能找到与他们相关的任何语言的内容。这个要求是有道理的,因为内容是高度可视化的,比如 Pinterest。所以即使我不明白“汽车”这个词在描述中是用法语写的,没关系,因为我最有兴趣看到这辆车。

Pinterest 非常适合跨语言搜索。例如,在 uk.pinterest.com I typed "coupe carrée" which is the French for "bob haircut" and all the results are visually relevant. 上,即使 pin 元数据是英文的,并且原始网站都是英文的。

这怎么可能? Pinterest 是如何与我的法语搜索查询内容相匹配的,其文本都是英文的?在某个步骤是否有翻译:coupe carrée > bob haircut > content contains "bob haircut"?

我查看了他们的工程博客,发现的只是检测网站原始国家和语言的技术。与管理搜索中的语言无关。

请让我知道这里是否是错误的地方来询问它是如何工作的问题。

提前感谢您可以分享的任何帮助/指示!

【问题讨论】:

    标签: search multilingual relevance


    【解决方案1】:

    在这种情况下,一般策略是使用您希望搜索的每种语言翻译为您的内容编制索引。

    这需要在索引时使用language translation API。和一个语言识别模型。 Here's a Solr example.

    【讨论】:

      猜你喜欢
      • 2017-04-03
      • 1970-01-01
      • 1970-01-01
      • 2020-10-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多