前面我谢了关于webmagic里Spider的博文,http://write.blog.csdn.net/postlist
现在写一篇关于webmagic关于PageProcessor的博文。
下面是PageProcessor代码,PageProcessor是一个接口
public interface PageProcessor {
/**
* process the page, extract urls to fetch, extract the data and store
*
* @param page
*/
public void process(Page page);
/**
* get the site settings
*
* @return site
* @see Site
*/
public Site getSite();
}
黄老师在webmagic文章中对PageProcessor的描述是
PageP


722

被折叠的 条评论
为什么被折叠?



