Seafile seafile-data/storage/fs inodes 索引量占用太多

更新：2022-09-22，已解决该问题，方法如下

相关讨论：

> https://bbs.seafile.com/t/topic/15833
> https://github.com/haiwen/seafile/issues/1309

解决办法：

a> 先看是不是使用了  Go 前端
![请输入图片描述][1]
确保它为 false，如果没有，直接添加相关配置项，手动定义为  false 以便覆盖默认行为避免某个更新版本后默认行为变更导致潜在风险
b> seafile 某个 python 模块依赖出现破坏
c> seafile  某个资料库出现某个文件损坏、索引丢失，无法被 seafile 正确处理，反而生成更多，产生巨量(千万级别) 几 B 的小文件

针对 a，按文章说法改回去默认前端，并且使用 `./seaf-gc.sh --rm-fs` 尝试手动清理 fs 对象，如果无效，按针对 b 和 c 的方法处理，针对 b  和 c，可以尝试先使用2个工具， fsck 和 fscg，分别用于检测资料库数据完整性和清理垃圾

这 2 个工具 只要有任意一个无法运行，或者运行时报错退出（python类的），或者 fsck 检测到损坏的资料库，并且修复后继续报同样的 ID 资料库损坏
不用再考虑了，使用 seafile 的 fsck 工具导出所有元数据到本地文件系统

然后备份相关原先 seafile 配置，直接重装 seafile，删除原来的 seafile，恢复配置文件，使用 https://cloud.seafile.com/published/seafile-manual-cn/deploy_pro/seaf-import.md
导入本地文件系统的 seafile 数据

最后应该能解决了，简单验证方法：运行fsck fscg 这2个工具，检查能否运行，且有无报错
特别是 `./seaf-gc.sh --rm-fs`，能否运行成功，能运行成功说明 可以正确处理 fs 对象了

观察几天，BUG 消失
![请输入图片描述][2]
![请输入图片描述][3]

find . -xdev -type f | cut -d"/" -f 2 | sort | uniq -c | sort -n

![请输入图片描述][4]

更新：2022-8-26 02:38:20  可以确认是 seafile 的新的前端服务 Go fileserver 有 BUG，产生了巨量巨量（千万级别）的几 B 的小文件，并且任意大于 几十 MiB 的文件，会上传失败，没任何报错，没任何预兆的在上传的某个时间会卡进度条，实际上已经没有产生上传流量了，即使碰运气上传完毕，也会卡在最后的 建立索引/保存文件 的进度提示

为了清空这些千万级别的 inodes 占用小文件，我用 `rsync --delete-before -d /tmp/blank/ /home/seafile/seafile/seafile-data/` 清空目录删了1个小时（服务端还是 raid10 SSD）
rm：？？？饶了我吧，删不动

所以去 seafile.conf 把这项改回去，一堆 BUG......，没事不要乱用新的前端，按照seafile官方说法：

> 提供了一个用 Go 语言重新实现的 fileserver 程序。默认依然使用原先 seaf-server 程序中提供的 fileserver 模块，可以通过选项切换到 Go fileserver。相比原有的 fileserver 模块，Go fileserver 有以下优势：
在高并发的环境下性能更好，避免由于部分请求处理时间过长而导致无法处理其他请求。
支持目录打包下载的 chunked 传输，无需等待整个目录打包完成再下载，而是打包和下载同时进行。这意味着不存在打包下载目录的大小上限。
支持对文件上传、下载进行限速。

[fileserver]
    
    use_go_fileserver = false

可惜我只是踩到了一堆永远填不完的大坑

----------
更新：2022-08-02 14:30

已向 seafile 反馈：https://bbs.seafile.com/t/topic/15833
类似 GitHub issue： https://github.com/haiwen/seafile/issues/1309

为了调试，目前准备导出资料库，再删除所有数据，再检查 inodes 占用。

更新：2022-8-7 18:37:52，经过备份导出数据后，再彻底删除 原来数据库，重新安装导入之前备份的文件，才恢复正常，目前还在观察该问题是否复现，
更新：一个星期不到，又来了，inodes 从 7% → 28%，几十万到 200 万 +，这几天的文件上传数量 ＜ 5 个，新增文件大小 ＜ 0.5 GiB，我也很绝望啊......

之前的多次测试，我有个推测，可能是 python3 的某个模块依赖更新导致不支持，或者 python3 版本太高，seafile 因为运行环境问题，没能正确处理 blocks ，事实上我的观察是，有巨量的 1 KiB 以下的、几十 B 的小文件存在，并且永远不会被清理，删光所有数据都不会被清理掉，跟 CG、清空回收站之类的低级失误无关，完全就是 BUG

----------

个人自用部署的 Seafile Pro v9.0.7 ，搭在一台 6c8g 160G SSD 的云服务器上面
`df -i` 显示

/dev/vda1      10485760 9261449 1224311      89% /

可以看到 IDC 还算厚道的给了千万级别的 inode，即使个人较多的小文件备份，一般也是够的，谁知道翻车了

个人使用了 35 GB 的空间，8 个资料库和 共计 15408 的文件数量（来自 seafile 的报告）![请输入图片描述][5]

问题是，这点文件数量，并且文件历史没多少，seafile 回收站也没什么文件，就能用掉 860 万 + 的inode
![请输入图片描述][6]
![请输入图片描述][7]

标记一下这个问题，看看怎么解决，还是说 seafile的 系统配置不合理？

[1]: https://p.0z.gs/i/2023/02/17/63eef5bc4b5ab.png
  [2]: https://p.0z.gs/i/2023/02/17/63eef5bc2a3df.png
  [3]: https://p.0z.gs/i/2023/02/17/63eef5bc306fa.png
  [4]: https://p.0z.gs/i/2023/02/17/63eef5bc24d43.png
  [5]: https://p.0z.gs/i/2023/02/17/63eef6574531d.png
  [6]: https://p.0z.gs/i/2023/02/17/63eef6574ec2c.png
  [7]: https://p.0z.gs/i/2023/02/17/63eef657542f2.png

更新：2022-09-22，已解决该问题，方法如下

相关讨论：

https://bbs.seafile.com/t/topic/15833
https://github.com/haiwen/seafile/issues/1309

解决办法：

a> 先看是不是使用了 Go 前端
请输入图片描述
确保它为 false，如果没有，直接添加相关配置项，手动定义为 false 以便覆盖默认行为避免某个更新版本后默认行为变更导致潜在风险
b> seafile 某个 python 模块依赖出现破坏
c> seafile 某个资料库出现某个文件损坏、索引丢失，无法被 seafile 正确处理，反而生成更多，产生巨量(千万级别) 几 B 的小文件

针对 a，按文章说法改回去默认前端，并且使用 ./seaf-gc.sh --rm-fs 尝试手动清理 fs 对象，如果无效，按针对 b 和 c 的方法处理，针对 b 和 c，可以尝试先使用2个工具， fsck 和 fscg，分别用于检测资料库数据完整性和清理垃圾

这 2 个工具只要有任意一个无法运行，或者运行时报错退出（python类的），或者 fsck 检测到损坏的资料库，并且修复后继续报同样的 ID 资料库损坏
不用再考虑了，使用 seafile 的 fsck 工具导出所有元数据到本地文件系统

最后应该能解决了，简单验证方法：运行fsck fscg 这2个工具，检查能否运行，且有无报错
特别是 ./seaf-gc.sh --rm-fs，能否运行成功，能运行成功说明可以正确处理 fs 对象了

观察几天，BUG 消失
请输入图片描述

find . -xdev -type f | cut -d"/" -f 2 | sort | uniq -c | sort -n

请输入图片描述

更新：2022-8-26 02:38:20 可以确认是 seafile 的新的前端服务 Go fileserver 有 BUG，产生了巨量巨量（千万级别）的几 B 的小文件，并且任意大于几十 MiB 的文件，会上传失败，没任何报错，没任何预兆的在上传的某个时间会卡进度条，实际上已经没有产生上传流量了，即使碰运气上传完毕，也会卡在最后的建立索引/保存文件的进度提示

为了清空这些千万级别的 inodes 占用小文件，我用 rsync --delete-before -d /tmp/blank/ /home/seafile/seafile/seafile-data/ 清空目录删了1个小时（服务端还是 raid10 SSD）
rm：？？？饶了我吧，删不动

所以去 seafile.conf 把这项改回去，一堆 BUG......，没事不要乱用新的前端，按照seafile官方说法：

提供了一个用 Go 语言重新实现的 fileserver 程序。默认依然使用原先 seaf-server 程序中提供的 fileserver 模块，可以通过选项切换到 Go fileserver。相比原有的 fileserver 模块，Go fileserver 有以下优势：
在高并发的环境下性能更好，避免由于部分请求处理时间过长而导致无法处理其他请求。
支持目录打包下载的 chunked 传输，无需等待整个目录打包完成再下载，而是打包和下载同时进行。这意味着不存在打包下载目录的大小上限。
支持对文件上传、下载进行限速。

[fileserver]

use_go_fileserver = false

可惜我只是踩到了一堆永远填不完的大坑

更新：2022-08-02 14:30

已向 seafile 反馈：https://bbs.seafile.com/t/topic/15833
类似 GitHub issue： https://github.com/haiwen/seafile/issues/1309

为了调试，目前准备导出资料库，再删除所有数据，再检查 inodes 占用。

更新：2022-8-7 18:37:52，经过备份导出数据后，再彻底删除原来数据库，重新安装导入之前备份的文件，才恢复正常，目前还在观察该问题是否复现，
更新：一个星期不到，又来了，inodes 从 7% → 28%，几十万到 200 万 +，这几天的文件上传数量＜ 5 个，新增文件大小＜ 0.5 GiB，我也很绝望啊......

个人自用部署的 Seafile Pro v9.0.7 ，搭在一台 6c8g 160G SSD 的云服务器上面
df -i 显示

/dev/vda1      10485760 9261449 1224311      89% /

可以看到 IDC 还算厚道的给了千万级别的 inode，即使个人较多的小文件备份，一般也是够的，谁知道翻车了

个人使用了 35 GB 的空间，8 个资料库和共计 15408 的文件数量（来自 seafile 的报告）请输入图片描述

问题是，这点文件数量，并且文件历史没多少，seafile 回收站也没什么文件，就能用掉 860 万 + 的inode
请输入图片描述

标记一下这个问题，看看怎么解决，还是说 seafile的系统配置不合理？

最后修改：2023 年 02 月 17 日

如果觉得我的文章对你有用，请随意赞赏

1 条评论

量子涨落
2022-08-02 14:34:16

尝试抢救下，打算备份数据之后，发工单给 IDC，让他改，结果回复......
Sorry, while it's possible to change the inode count while formatting the disk of a physical server, I'm afraid it will not be possible in this case since these are cloud servers created using templates.
机翻：
抱歉，虽然可以在格式化物理服务器的磁盘时更改 inode 计数，但恐怕在这种情况下不可能，因为这些是使用模板创建的云服务器。

回复

发表评论取消回复
使用 cookie 技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

1 条评论

发表评论 取消回复 使用 cookie 技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Seafile seafile-data/storage/fs inodes 索引量占用太多

发表评论取消回复
使用 cookie 技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款