浅析scrapy与scrapy_redis区别( 三 ) _scrapy

文章插图

格式是set，即不会有重复数据。前者就是redis的去重队列，对应 DUPEFILTER_CLASS，后者是redis的请求调度，把里面的请求分发给爬虫，对应 SCHEDULER。（里面的数据不会自动删除，如果你第二次跑，需要提前清空里面的数据）
缺点是，Scrapy-Redis调度的任务是Request对象，里面信息量比较大（不仅包含url，还有callback函数、headers等信息），可能导致的结果就是会降低爬虫速度、而且会占用Redis大量的存储空间，所以如果要保证效率，那么就需要一定硬件水平。

【浅析scrapy与scrapy_redis区别】

浅析scrapy与scrapy_redis区别( 三 )

推荐阅读

新疆新增13例本土病例：新疆新增13例本土病例境外输入病例31例

何何爱八卦|有事相求粉丝是九亿少女，平日无事调侃为九亿大妈，林更新太贱了

普洱茶发展展望,普洱茶产业稳定健康发展

外星人|波兰森林的垃圾，是外星人丢弃的？不明物体引阴谋论者猜测！

痘痘能吃青菜香菇包吗

夜樱动漫|前程光明，富贵吉祥的四大属相，9月开始家财万贯

啥是真正意义上的“正确”

聚光体育|高腰版型的下衣，衬托出腰身的苗条，颜色形成鲜明的对比

男孩边骑车边哭，转了十多圈大家发现了异样……

当孩子问为什么要努力学习时，这5个理由让他心服口服

KD说球|休城23分惨败出局，德帅却不想走！再见哈登，你终于解脱了

行走自由的花|去参加好朋友婚礼，喝醉醒来后，自己却成了新郎，清朝一书生

和谐宁武|宁武县召开2020年普通高等学校招生考试动员会

洋哥爱生活|姻缘重返，真情相告，情深依旧，邂逅旧缘，再度相逢，9天之后

挂牌|挂牌督办！西安一村支书竟组织领导涉黑团伙，成员达37人，涉案30余宗！

新鲜柠檬马鞭草,柠檬马鞭草的注意事项

久违的合影：日本外相访华，晒出与华春莹微笑自拍

首要任务|读书｜要认识现代诗歌，首要任务是寻找范畴来描述现代诗歌

涛涛不兴|桃花不断，家财万贯，事业大有成就，百事大吉的属相，8月发发发

女演员遭已婚老板长期骚扰，要求解约却被起诉！微信聊天记录救了她