【发布时间】:2019-02-10 22:24:47
【问题描述】:
向网络爬虫提供访问者看不到的消息(文本字符串)的最佳方式是什么?
用例:我的网站正在被抓取,这很好,但我想向抓取工具提供一些对我的访问者不可见的额外数据。如何有效地做到这一点?
我可以在<span> 标记之间包装一段文本,并在页面加载时使用 JavaScript 为访问者隐藏它,但抓取工具可能会运行 JavaScript 并在删除字符串后抓取副本。如何避免这种情况?
【问题讨论】:
-
"什么是最好的方法" 你必须知道这个问题是非常基于意见的。也许添加一些“最佳”(最有效,最安全)的上下文以避免您的问题被关闭。
-
答案取决于什么样的“刮板”