【问题标题】:Can a published Google Sheet, referred to via PHP only, be stumbled upon or indexed by Google?仅通过 PHP 引用的已发布 Google 表格是否会被 Google 偶然发现或编入索引?
【发布时间】:2015-10-06 23:06:58
【问题描述】:

我已经阅读了这方面的内容,但看到了相互矛盾的观点,因此请在此处寻求帮助。

我有一个已发布的 Google 表格,其中包含一些轻度敏感数据。我使用 PHP 访问内容,然后在仅限会员的网页中向不同的人展示特定部分。假设我从不超链接到已发布的工作表:

  1. 已发布的工作表是否被 Google 索引?

  2. 用户能否通过标头或其他测量流量的方式推断已发布的 Google 表格的完整 URL 是什么?

【问题讨论】:

  • Google 文档只对编写它的人和曾经授予访问权限的人开放。如果您通过 php 脚本使其可用,则每个人都可以看到该脚本\url

标签: php google-sheets google-crawlers


【解决方案1】:

PHP 在服务器端运行(如果 App Engine 是 Google 服务器)。 当您从服务器请求电子表格数据时,用户必须监听您的服务器和电子表格服务器之间的流量。由于您使用 App Engine,两台服务器都是 Google 服务器,因此很难监听此通信。因此,除非您将工作表的 URL 放在 <?php ?> 标记之外的某个位置,否则任何人(包括搜索索引爬虫)都无法扣除电子表格的原始 URL。

但是: 由于您在网页上显示电子表格中的数据,因此搜索索引器可以索引该数据,从而间接索引电子表格。如果有人不小心将 URL 共享到了您的电子表格,并且索引器也发现了该 URL,则可以判断您网站上的数据来自该工作表。

【讨论】:

  • 这是一个非常有用的答案。但是,大概搜索索引器无法索引需要用户登录的页面?因此,正确的说法是,如果用户登录到我网站的私人区域,然后 PHP 只显示与该用户名匹配的 Google 表格行,则用户无法获取与其他行相关的数据,或者在某些情况下如何找到完整的 URL?
  • 只要你的 php 脚本是安全的,那就是正确的。永远不要相信用户输入通常是明智的。确保用户无法更改显示的行(即,按照您的预期指定不同/附加参数)
猜你喜欢
  • 2011-05-22
  • 1970-01-01
  • 2012-11-16
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-08-14
相关资源
最近更新 更多