【发布时间】:2010-12-14 07:11:02
【问题描述】:
你们将如何在 .Net 平台上创建“实时”搜索引擎。近乎实时的网络搜索现在非常流行,我希望你们能帮助我集思广益。我最终可能会尝试制作一些原型,但大多数情况下它只是一种“心理训练”。
要求是:
- .NET 平台、IIS、MS SQL 服务器或 Lucene.Net(文件系统)
- 要索引的输入数据只是关键字加上一些元信息 - 无需进一步处理
- 数据按关键字分组并按关键字出现次数排序
- 不保留任何历史数据(超过某个固定时间的数据将被丢弃或移至其他数据存储区)
对这个主题了解不多,这是我迄今为止想出的:
数据通过网络服务提供给系统。由于数据已经是关键字的形式,因此不进行进一步的处理。 WS 将数据保存到 db。选择查询以固定的时间间隔执行以返回数据(例如:我们查询过去一小时的传入数据并每秒执行一次查询)。分组和排序在内存中执行以卸载 sql server。 db 中的旧数据每隔几分钟就会被丢弃一次。 我不确定如果不断添加许多新行,sql server 将如何处理。 然后显示分组和排序的数据。
我相信你们对这种事情有更多的经验和更好的想法。
问候,
翁德瑞
【问题讨论】:
-
您能举出一些您认为可能相似的网站示例吗?
-
我想到的网站是search.twitter.com。我想要实现的功能是那里的“热门话题”。
标签: .net sql-server search lucene.net real-time