:) 今天决定暂停蜘蛛算法修改了, 从开始写已经快两个月的吧... 中间算法大改N次, 小改每天N次...
 
目前状况是, 广度优先, 512M内存可以抓取50W-100W页面, 本想能无限抓的... 最近一个月的持续改动目标, 理想还是理想呐...
 
对于CSDN之类大型网站采用办法是分目录索引.
 
 
之后再接着写吧. 最近被折磨坏了. 一个软件就是一个孩子, 会随着我的成长 成长的.
 
天佑它, 也佑我.

相关文章:

  • 2021-05-09
  • 2021-05-29
  • 2022-12-23
  • 2021-08-03
  • 2021-06-02
  • 2021-07-03
  • 2022-12-23
猜你喜欢
  • 2022-03-07
  • 2022-12-23
  • 2021-05-30
  • 2022-12-23
  • 2021-11-10
  • 2022-01-13
  • 2021-07-25
相关资源
相似解决方案