最近有不少用户咨询一个问题:
来源频道有几十万数据,如果用采集猫,能不能一个星期搬运完?
我的回答是:
如果只用一个爬虫账号,一个星期搬运不完,两个星期都搬运不完!
原因如下:
1,当前,telegram对飞机账号的管控非常严格,动不动都会被限制,所以我们能做的只有降低采集猫的请求速度,防止被限;
2,新注册的telegram账号本身在飞机的体系中是有请求限制的,具体多少,我们不得而知,但是经过我们的不断测试,我们发现,飞机对每个账号的请求次数是不同的,新账号一般不能超过20次,我们建议10次;老账号不超过40次,我们建议25次;老账号+telegram高级会员,一般不要超过50次,我们建议40次;
3,所有的限制,并非采集猫的限制,而是飞机本身的限制,你发的多,就死的快;
4,假如一个10W帖子的频道,我们想搬运过来,我们简单计算一下一个爬虫账号的搬运时间:
最大请求设置25,转发群限速设置为0(不限速),每分钟最大发送次数理论上可以达到20次,每天就是20*60*24=28800次,十万的数据,也就是一周时间能结束(如果有很多合辑的话,则速度会降低);
5,这里强调一点,飞机账号被封,并不是使用了采集猫,而是因为某些操作触碰了telegram的红线,采集猫是基于飞机官方的tdlib库开发而来,并不是外挂程序,所以不会被飞机针对;