【发布时间】:2016-01-17 14:50:53
【问题描述】:
我正在尝试在旧的 TYPO3 4.5 网站上使用索引搜索和站点爬虫索引页面 - 但我尝试了几乎任何方法都无济于事。
我正在运行网站爬虫,它会获取可以爬取的 URL 的完整列表,并且我正在运行整个队列
我已经设置了一个“索引配置”
还有一个网站爬虫
但它不会索引
“cache_pages”表似乎也是空的 - 但所有页面都启用了缓存。
我可能会错过什么?
【问题讨论】:
-
您是否添加并运行了一个调度程序任务以通过收集的 URL 进行爬网?队列视图上应该有一些状态 - 好的,或者一些错误。但是什么都没有
-
所有页面都显示OK!但是没有任何东西被索引!但是我在根目录下确实有一个页面,它有自己的 TypoScript 模板!该页面确实被编入索引,但不是下面的页面!
-
很难猜测,如果您的较低级别页面包含例如一些 COA_INT 或 USER_INT(非缓存)元素,则该页面将不会被索引。
-
您是否在您的排版设置中设置了 `page.config.index_enable = 1`?
-
我设置了 index_enable = 1。我以某种方式怀疑 rootpage 是课程问题。那是被索引的,但不是孩子。
标签: php indexing web-crawler typo3 typo3-4.5