【发布时间】:2015-04-20 18:27:54
【问题描述】:
我有一整本包含关键词丰富的原创材料的电子书,我想将其添加到我的网站以帮助提高搜索引擎排名。问题是我不希望任何人能够查看这些页面,但我仍然希望搜索引擎抓取它们。这是必要的,因为电子书内容是专有的。
如果有人应该在搜索引擎中输入在我的一个页面上找到的特定文本字符串,我不希望 Google 将该页面显示为搜索结果,但可能会提供指向只能解锁的页面的链接通过登录并购买电子书页面。
我一直在查看 Prerender.io,看看是否可以在爬虫请求时呈现乱码版本。在路由到实际的电子书内容页面之前,我不确定这将如何与 Express.js 中间件中的身份验证过程一起使用。我认为服务器可以根据用户或爬虫是否请求电子书页面来提供不同版本的页面。 但这甚至可能吗?或者对我想要实现的目标有什么建议或不同的设计?
谢谢。
【问题讨论】:
标签: web-crawler google-crawlers prerender