【问题标题】:From a development perspective, how does does the indeed.com URL structure and site work?从开发的角度来看,indeed.com URL 结构和站点是如何工作的?
【发布时间】:2013-01-10 19:57:40
【问题描述】:

在站长的问答网站上,我问了以下问题:

https://webmasters.stackexchange.com/questions/42730/how-does-indeed-com-make-it-to-the-top-of-every-single-search-for-every-single-c

但是,我想从开发的角度了解更多信息。

如果您在 Google 上搜索任何与工作相关的内容,例如 Gastonia Jobs(城市 + 工作),那么除了他们的搜索结果占据 Google 的首页之外,您还会得到一个如下所示的 URL 结构:

indeed.com/l-Gastonia,-NC-jobs.html

我假设 L 代表 URL 结构中的位置。如果您搜索与行业相关的工作或具有特定公司名称的工作,您将得到类似以下内容(Microsoft 工作):

indeed.com/q-Microsoft-jobs.html

美国有超过 40,000 个城市,我想,好吧,也许他们有可能遍历它们并为每个城市创建一个页面。这对计算机来说并不难。但显然该站点是动态的,因为每个页面都有 10000 个结果并以 10 为单位分页。上面的 q 显然代表查询。我可以理解的位置,但他们不可能为每个查询组合创建一个网页,不是吗?

好吧,这有点奇怪。我想看看他们是否有站点地图,所以我在 Google 中输入了“indeed.com sitemap.xml”,得到了回复:

indeed.com/q-Sitemap-xml-jobs.html

.. 再次,我搜索了“indeed.com url structure”,正如我在网站管理员的另一篇文章中提到的那样,我回来了:

indeed.com/q-change-url-structure-l-Arkansas.html

Indeed.com 是否以某种方式使用编程根据我对谷歌的搜索输入动态创建网页?如果他们不是,他们如何能够为数百万和数百万可能的查询组合提供静态页面,让它们动态分页,然后让所有这些控制谷歌的第一页结果(尽管最后一个问题可能是最好的对于网站管理员 QA)?

页面中的 javascript 是否以某种方式与 URL 交互

【问题讨论】:

    标签: url hyperlink seo url-routing search-engine


    【解决方案1】:

    很可能不是一堆页面。 “实际”页面可能是http://indeed.com/?referrer=google&searchterm=jobs%20in%20washington。然后,该站点巧妙地使用 URL 重写生成人类可读的 URL,在数据库中获取与查询匹配的作业,然后瞧……

    当然,我可能大错特错。说实话,它的技术方面可能可以通过多种方式解决。每次将作业添加到站点时,可能会创建与该作业匹配所需的所有页面,从而产生大量页面供 Google 抓取。

    【讨论】:

    • 嗯,这是个好主意。由于他们可能已经拥有指向该原始页面的链接,因此他们可以为此进行排名。这也可以解释 SEO。我从来没有看过我的网站的谷歌搜索词的引用结构。我很好奇。我会检查一下。
    • 你能在谷歌中创建一个页面并获得排名吗?我不这么认为。该网站必须有预先构建的页面并以某种方式在内部链接它们。这些页面中的每一个的关键字和描述都将与查询模式相匹配。甚至谷歌也根据其抓取、分析和存储的内容获取数据
    【解决方案2】:

    这是一个很好的问题,但仍然没有答案,因为基本的 Google 搜索使用,

    ste:indeed.com
    

    返回超过 120MM 的结果,其次是“product manager new york”等查询在结果中排​​名第一。这些页面显然是预先生成的,这可以通过搜索引擎缓存的页面(有时是几天前)与网站上的实时查询有不同的结果来证实。

    【讨论】:

      【解决方案3】:

      当 Google 的搜索机器人抓取确实或任何其他求职网站上的页面时,这些页面是动态创建的。这是另一个站点:http://jobuzu.co.uk 我运行此站点,这与实际工作方式相似。

      PHP 在这方面是您的朋友,而且确实不要只使用标准数据库查看 Sphinx 和 Solr,因为它们提供全文搜索以获得比 MySql 等更好的性能。

      【讨论】:

        【解决方案4】:

        他们还巧妙地利用了 rel="canonical" 和彻底的内部链接: http://www.indeed.com/find-jobs.jsp

        请注意,所有实际排名的页面都可以从该直接内部链接结构中找到。

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 2022-12-21
          • 2011-08-22
          • 1970-01-01
          • 2013-09-18
          • 1970-01-01
          • 2011-02-20
          • 2010-11-10
          • 1970-01-01
          相关资源
          最近更新 更多