爬虫监控

在导航栏中点击查看进度就可以看到当前爬虫的运行状况,在这个界面中可以实现对爬虫的停止,删除,查看进度,查看已抓取的数据,查看模板等操作.

spiderList

注意,按照采集平台默认配置,这里的所有爬虫运行记录将在每两个小时对于已经完成的爬虫进行删除.如果不想让系统定时自动删除任何爬虫记录,或者改变删除记录的时间周期,请参阅高级配置中对于配置文件的解释部分.

按钮名称 作用
查看状态 弹出模态框,显示抓取过程中的信息,例如下载出错,解析网页出错等等
查看详情 查看JSON格式的采集详情,包含更多信息,例如存活线程数量,采集模板等等
编辑模板 编辑当前任务的爬虫模板
查看数据 查看当前抓取任务对应域名的数据
停止 停止当前爬虫
删除 删除当前爬虫

点击最上方发红色删除全部已停止爬虫按钮即可删除所有已经停止的爬虫,这个操作并不会删除库中的数据。

results matching ""

    No results matching ""