一觉起来,收到一堆 IDC 通知告警,服务器好像炸了,发现某个子站莫名其妙的被一堆爬虫轮番压榨,有点不堪负重,看了下都是这些家伙
特别有几个战犯,好家伙不约而同一起爬,一分钟几千次的请求,点名 Claude、Bing、Amazon

是我太温柔了吗,不是的, Robots 本来就是君子协定,而且即使 UA 管控,使用白名单模式,非白名单的直接 403,部分蜘蛛也会耍花招换 UA 的,然后我也没想到要限制频率,所以就大大方方全部写允许了,结果就......,服务器配置也有点低,上面还跑了一些其他资源密集型应用

总结:就谷歌和 OpenAI 还会收敛点,还有那个没见过的 DotBot
以后也长期更新一下这个列表


最后修改:2025 年 06 月 11 日
如果觉得我的文章对你有用,请随意赞赏