【发布时间】:2023-03-24 05:58:01
【问题描述】:
我有一个 Drupal 网站,其中的页面由 Google Mini 搜索设备编入索引。
本周早些时候,我注意到一堆链接被标记为已编入索引,但被排除在外,因为有一个“打印此页面”链接返回到同一页面并且有一个 rel="nofollow"。两天前,我取出了 nofollow 并让 GSA 重新索引该站点。
现在,相关页面在 GSA 中被标记为已编入索引,但它们并未显示在网站的搜索结果中。
我可以在 /search/google_appliance/TERM 进行搜索,但它们没有出现。当我搜索其他术语时,它们确实出现了。换句话说,我知道 GSA 正在工作。
当我在 /search/node/TERM [Drupal 默认搜索] 进行搜索时,我得到了不同的 Drupal 结果[显示了该术语的页面]。这让我很确定我正在达到 GSA。
关于为什么新编入索引的页面没有出现在 GSA 搜索中的任何想法?
编辑/已解决: 有几个问题。以前,搜索使用 xslt 来处理它如何显示页面,以及当您点击提交时它在页面上发送查询的位置(在设备上,而不是网站上的提交按钮)。查询字符串以旧格式传递给站点,然后给出 404(就像您搜索 bookstore.site.com 和 origin.site.com 一样)。更多的是“无法从这里到达那里”之类的问题,而不是与搜索有关的任何问题。我已经删除了 xslt,所以它只使用了默认的 google 外观,让我们可以对设备的数据库进行很好的通用搜索。
但是,仍然返回了一些 Drupal 模块无法解析的奇怪搜索结果,并且日志被 simplexml_load_string() [function.simplexml-load-string]: ^ in \sites\all\modules\ google_appliance\GoogleMini.php 在第 318 行。
我尝试了一些查询字符串变量并注释掉设置输出编码的行,一切似乎都有效。 有问题的行位于第 322 行的 google_appliance.module 中:
$gm->setOutputEncoding('utf8');
【问题讨论】:
-
这方面有什么进展吗?您是否发现了任何有助于减少要考虑的假设数量/有助于追踪问题的进一步信息?
标签: search drupal google-search-appliance drupal-5