【发布时间】:2013-10-05 05:46:13
【问题描述】:
我想写一个单词搜索,它连接到一个特定的网站(巨大的),从用户那里获取单词,搜索站点并返回包含该单词的字符串;这应该用 java 和作为 applet 编写.我已经阅读了一些关于此的教程和问题,并了解必须做的是:
1.连接到网站并获取网站内容并将其保存为字符串。(这应该使用网络爬虫完成,该爬虫将由我自己的代码制成,用于连接网站并将内容保存到字符串+ jsoup 库来解析 html 代码)。
2.将数据保存到数据库(在我的情况下为 nosql 数据库)。
3.索引数据库中的数据。
4.查询数据库以显示结果。
5.制作一个显示搜索结果的UI(我使用swing.japplet)。
现在我的问题是:
1.我是否正确理解了我必须执行的步骤?(如果步骤是不必要或必要的,请详细说明)
2.有必要有数据库吗?
注意:我想自己实现,不使用现成的东西,如lucene,nutch,solr,...
edit:3个人告诉我applet不适合这样的事情,那么应该换什么?
非常感谢您的帮助。
【问题讨论】:
标签: java search search-engine web-crawler keyword-search