前言:本文是“含有分页的普通文章的采集方法“的第三节,在前两节的基础上,将会对“如何采集指定节点”和“如何导出采集内容”做详细的介绍。为了与前文保持一致,本文将延续使用前文的章节标记。
上接第二节。
3.1采集指定节点
单击“保存并开始采集“后,将会进入”采集指定节点“界面,如(图29)所示,
图29-采集指定节点
每页采集:这是设置每页所需采集的条数,并可根据网站是否有防刷新功能,设置采集间隔时间。
特殊选项:设置是否检测重复图片,默认为“检测”。
附加选项:此选项一共有3种采集模式可供选择:第一种为“监控采集模式(检测当前或所有节点是否有新内容)”,选取后,系统只会采集指定节点中更新的内容;第二种为“重新下载全部内容”,选取后,系统会采集指定节点中的全部内容;第三种为“下载种子网站的未下载内容”,选取后,系统只会采集指定节点中未下载过的内容,包括以前没下载的和更新的内容。
设置完成并确定无误后,可单击“开始采集网页”或者“查看种子网址”。此时,如果单击“查看种子网址”会看到列表是空的,这是因为新建立的采集节点从未采集过,如(图30)所示,
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)