【发布时间】:2012-02-02 00:18:34
【问题描述】:
我是第一次为工作设置 GSA 盒子。我已经建立了与成功抓取所有行的数据库(用于人员搜索)的连接。然后它为我创建了一个提要,但总是返回 "Failed in error",并在日志中显示以下内容:
ProcessNode: Does not match patterns, skipping record with URL: googledb://<host>/<Database>/azE9MTIsMQ
所以我尝试将数据库添加到爬网列表中(即来自Google Search Appliance index content from database)。但这总是会返回
^googledb:// will not be included because it does not match any of the 'Follow and Crawl Only URLs' pattern
我终其一生都无法弄清楚该部分的内容。我需要在 Follow and Crawl Only URLs 字段中包含什么值?
【问题讨论】:
-
我已经通过在两个字段中放入整个数据库路径来暂时解决它。
标签: database feed google-search-appliance