清除爬取历史 有什么作用呢?清除发送历史🆕 有什么作用呢?
🔘【清除爬取历史】的意思是:以前爬取过的历史记录会被清除,清除以后就可以重新开始爬取了;采集猫为了过滤重复,有一个过滤规则就是,爬取过的就不再爬取了(本地有记录),防止重复爬取;但是在实际爬取过程中,会出现一些意外情况,需要重新爬取,本功能就是为了解决这个意外而产生的!
🔘【清除发送历史】🆕的意思是:采集猫为了防止重复发送,才用了重复过滤功能,不仅爬取的时候会过滤重复,发送的时候也会过滤重复,两次过滤,尽量降低重复发送的概率!清除发送历史 主要是用于某些特殊情况下需要清除发送记录,重新进行发送,此时就可以选择清除 转发群 的发送历史,使用该功能之前,请先清除爬取历史后再清除发送历史,才可以对已经发送过的内容进行二次发送!
图二,点击【清除爬取历史】以后,会弹出个窗口,该窗口里面罗列了所有的对话列表,您可以选择需要清除历史进度的对话(来源群),如本图,弹窗的右侧窗口有个“小宝- Ai中文群”,意思是需要清除这个来源群的爬取历史(其他群/频道不会被清理,选择哪个就清理哪个,可以多选或全选),点击确定以后,如图一圈中的地方,会提示“
💡 接收到清除爬取进度请求,处理中(正在进行中的爬取可能处理失败,故最好在停止爬取服务时清除进度)……
💡 清除爬取进度请求,已处理完成
此时代表已经清理完成了,可以重新爬取这个群的消息了!
⚠️注意:
🔘如果图二的对话列表中无法找到您需要的群/频道/机器人等,您可以点底部的【刷新】按钮,该按钮是刷新对话列表的,点击【刷新】以后需要关闭该窗口等待半分钟左右再打开才能显示出所有的对话列表,具体操作看上面一期的教程【来源群/转发群 添加的时候,弹窗的待选择框为空或者已加入的频道/群组没有全部显示出来,怎么办?】。
🔘清理历史进度之前,请先停止爬虫服务,再操作,否则有可能会导致历史进度清理不彻底!
🟢特别注意的是,想实现已经发送过的内容二次发送,请先清除爬取历史后再清除发送历史,才可以对已经发送过的内容进行二次发送!
===========================
❤️‼️使用场景:1
1️⃣由于某种需要,需要对已经爬取过的群/频道二次爬取,您需要先清理进度后才能执行二次爬取;
2️⃣方案设置里面,如果您爬取的有历史,并且对某些群/频道的历史爬取式一段一段的,而非连续性的,那么您爬取完一段历史后,想爬取下一段历史,那您也需要先清理一下历史进度后再进行下一段的爬取(采集猫做了一些限制,比如您想爬取A频道的从【2023-12-01日—-2023-12-20日】和【2023-10-01—2023-10-20日】的数据,因为数据是两段,并非连续的时间段,所以您需要先爬取第一段【2023-12-01日—-2023-12-20日】的数据,爬取完以后,点击【清除历史进度】清除A频道的爬取历史进度,然后再开始第二段【2023-10-01—2023-10-20日】的爬取!
- 这里请特别注意!
特别注意
↩︎