火车头采集器怎么用?

火车头采集器怎么用?,第1张

软件程序的获取:

大家可以从百度中搜索“火车头采集器”,并进入对应官方来获取程序的最新版本下载地址。当然也可以悄知从小编所提供的网盘地址中获取最新版本程序:

请点击输入图片描述

请点击输入图片描述

2

安装并运行“火车头采集器”程序,在d出的登陆界面中直接点击“登陆”按钮就可以以免费版身份登陆。

请点击输入图片描述

3

在程序主界面中,点击“新建”下拉箭头,从中选择“任务”项。

请点击输入图片描述

4

在d出的窗口中,输入“任务名”,同时点击“起始网址”栏目右侧的“添加”按钮。

请点击输入图片描述

5

接下来就极为重要的一步,就是对要进行采集的网站进行分板,对所采取的网站中各片文章的URL进行综合分析并找出规律,最后按如图进行填写。

请点击输入图片描述

6

然后切换至姿扮“第二步:采集内容规则”选项卡中,我们需要对网页内容进行分板。在此以“搜狗浏览器”为例,右击要进行分析的网页,从d出的菜单中选择“审查元素”项。

请点击输入图片描述

7

在“开发式模式”界面中,点击“选择页面中的一个元素去透视”按钮,接着点击“标题”内容,此时就可以在“开发者”窗口中显示标题所对应的标签,此例为“h2"。

请点击输入图片描述

8

接下迹运灶来在”采集内容规则“界面中,点击“添加”按钮来添加“标题”项,或者直接双击“标题”项进行修改。在d出的界面中,勾选”前后截取“,将设置前后辍分别为"<h2>“、”</h2>".

请点击输入图片描述

9

利用同样的方法添加其它采集内容的规则。

切换至“第三步:发布内容设置”选项卡,勾选“启用 方式二”,并进行如图设置。

请点击输入图片描述

10

最后从任务列表中,勾选要采集的内容,点击“开始”按钮就可以按规则采集网站中的网页内容啦。

请点击输入图片描述

如果还有啥问题,请留言或者私信,如果回答的还算可以,请列为最佳答案

完全没看懂你想友宏宽问什么,你是想说需要采集某个标签然后发布到DEDE还是其他的意思?

如果是采集标签,首先讲绝猜采集部分,需要针对该采集部分添加一个标签去采集,具体的就是在火车头的那个采集规则里添加,

发布部分需要在DEDE中后台添加好亮字段,然后修改火车头发布模块(如果dede原本就带有的话就不需要修改)

1、首先在采集列表页的源码中将带有缩略图的那部分源码复制下来,如图:

2、查看网站的源码,找到这行代码,如图:

3、打开火车头,进入采集网址规则—添加多级网址采集规则,选中手动填写链接地址规则,并将第二步骤中选中的代码粘贴进去,如前桐图:

4、将代码进行如下修改:

5、改好后保存并进行采集测试,如图所示

6、然后再在采集内容规则里进行修改,选中“缩略图”标签,打开,进行内容替换,如图:

7、然后点击文件下载,选哪悔销中下载图片,并填好缩略图保存路径及命名方式,如图:

8、在“文李游件保存及部分高级设置”里设定缩略图的保存盘符及其前缀,我设定为桌面,前缀为“./”,如图:

9、我们保存后测试一下,一起顺利,缩略图顺利采集下来了


欢迎分享,转载请注明来源:内存溢出

原文地址: http://www.outofmemory.cn/bake/11979946.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-20
下一篇 2023-05-20

发表评论

登录后才能评论

评论列表(0条)

保存