(1)做得好,做得快,只能选择一样。

(2)时间过得很快,你没法在假期的一天里完成更多的计划。假期全部由自己支配,相对长一点的睡眠,新加入的娱乐(视频或者游戏),你不比在工作中更有效率。

(3)每天练习一点,记录下来。假期来整合优化巩固,是最好的选择。进步每一天。

(4)不要太期待假期。

(5)参照Nutz 入门教程第一讲,做一个小应用。 视频不清晰还是看完两遍,还是照着一点点的写出来。视频比较直观,Nutz的文档很详细的,但是任然觉得看视频还是更快,看文档太慢了,或许我看文档的方式要改进下。

(6)JAVA爬虫 WebCollector: 

官网APIosc简介Cookbook&Api

一个读取API的例子:MyParser.java, DocCrawler.java

package demo.hello;

import java.io.UnsupportedEncodingException;

import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import cn.edu.hfut.dmic.webcollector.model.Link;
import cn.edu.hfut.dmic.webcollector.model.Page;
import cn.edu.hfut.dmic.webcollector.parser.HtmlParser;
import cn.edu.hfut.dmic.webcollector.parser.ParseResult;

public class MyParser extends HtmlParser{
    public MyParser(Integer topN) {
        super(topN);
    }

    @Override
    public ParseResult getParse(Page page) throws UnsupportedEncodingException {
        ParseResult parseResult= super.getParse(page);
        Elements frames=page.getDoc().select("frame[src]");
        for(Element frame:frames){
            Link link=new Link();
            link.setAnchor("");
            link.setUrl(frame.attr("abs:src"));
            parseResult.getParsedata().getLinks().add(link);
        }
        return parseResult;
    }
}
View Code

相关文章:

  • 2021-10-07
  • 2022-12-23
  • 2022-12-23
  • 2021-10-14
  • 2021-05-24
  • 2021-11-26
  • 2021-07-29
  • 2021-06-24
猜你喜欢
  • 2021-04-28
  • 2022-12-23
  • 2022-01-31
  • 2021-12-05
  • 2022-01-24
  • 2021-05-27
  • 2022-12-23
相关资源
相似解决方案