【发布时间】:2010-07-29 08:03:51
【问题描述】:
我正在使用 gettext 设置多语言。由于其他语言的所有文本都在编译的 .mo 文件中。我应该如何攻击网站的搜索功能?任何帮助或方向将不胜感激。注意,我之前没有编写过搜索引擎……
【问题讨论】:
标签: php search internationalization gettext
我正在使用 gettext 设置多语言。由于其他语言的所有文本都在编译的 .mo 文件中。我应该如何攻击网站的搜索功能?任何帮助或方向将不胜感激。注意,我之前没有编写过搜索引擎……
【问题讨论】:
标签: php search internationalization gettext
据我了解,您希望提供对存储在 .mo 文件中的信息的搜索;键值对的文本文件。
问题在于将特定 .mo 中的 k-v 对映射到特定 URI。如果你能做到这一点,你可以运行一个脚本来解析 .mo 文件,并将短语与相关的 URI(或其他资源标识符)一起存储在某种数据存储中,例如 Apache Solr 或 MySQL detabase(带有FULLTEXT 索引列)。
另一种选择是使用爬网程序按关键字和语言对您网站中的所有页面进行搜索和索引。以下是开源爬虫列表:
http://en.wikipedia.org/wiki/Web_crawler#Open-source_crawlers
一切顺利。
【讨论】: