爆炸记录¶

时区

以下所有日期时间均按 UTF-8。

2026年2月10日：RSS更新停滞¶

2026年1月14日更新通知来源时，修改了某些来源的名称，例如“知艺”改为“设艺”。然而部署时未完整进行兼容操作，导致RSS模块自当日起报错，无法更新feed.rss。其它模块未受影响，仍能正常获取通知并显示于网页。

2026年2月10日fishyy119反馈并定位错误，现已恢复。

2025年12月27日：所有服务失效¶

今日17时升级操作系统Ubuntu，意外造成AppArmor服务掉线，导致podman无法工作。23时通过重启AppArmor恢复。

在调试过程中重置了podman，导致 BIT 网站的非官方监控数据丢失，“时代的眼泪”遗憾消逝。其余数据未受影响。

2025年11月28日：网站无法访问¶

今日 03:35，因一程序大量写入无用日志，占满了服务器硬盘，导致无法处理网络请求。

08:49 已恢复，未丢失数据。

2025年9月17日上午：无法加载通知 JSON¶

服务器硬盘满了，导致无法处理网络请求。

13:53 已恢复，不过丢失了以往通知数据。

2024年11月19日下午：MS Edge 131+ 无法加载通知¶

我们使用 ky 处理网络请求。这个包的旧版本违反了某个规范，导致无法在 131.0.2903.51 等版本的 Edge 中使用（MS Edge 130.0.2849.56 或更低版本正常，另外有同学回忆十一月初还没问题）。更新 ky 后即解决问题。

https://github.com/sindresorhus/ky/issues/467

Firefox 等其它浏览器不受影响。

2024年4月13日晚上¶

大约22:40开始504，重启无效，可能是证书问题。

22:51恢复，确实是给 Traefik 的证书不对。

2024年3月5日上午¶

又 Gateway Timeout 了。

重启后恢复。

2024年2月7日中午¶

最晚12时开始，通知空白，只剩CDN缓存。服务器连不上SSH，供应商控制台显示CPU、内存使用率大概都在90%以上。13:26重启完就好了。

2024年2月4日中午¶

13:50 开始 504 Gateway Timeout，现象同之前。重启多次未恢复。

从时间上看，之前的证书与今天13:44:35过期，不过不确定具体机制。

15:12更新了证书，恢复。

2024年1月29日下午¶

现象同上次，sudo reboot恢复。

2024年1月2日上午¶

2024-01-02T06:58:38+08:00 Traefik 自动重启，成功停止，但启动时卡住，所有服务在 CDN 缓存过期后 504 Gateway Timeout。

重启时提示“Error: OCI runtime error: crun: cannot open status file: No space left on device”，原因是 inode 满了。

$df --inodes --human-readable
Filesystem     Inodes IUsed IFree IUse% Mounted on
…
tmpfs             43K   43K    15  100% /run/user/1000

$ sudo du --summarize --inodes /run/user/1000/*
1       /run/user/1000/bus
171     /run/user/1000/containers
49      /run/user/1000/crun
2       /run/user/1000/dbus-1
6       /run/user/1000/gnupg
42943   /run/user/1000/libpod
13      /run/user/1000/netns
1       /run/user/1000/pk-debconf-socket
2       /run/user/1000/podman
1       /run/user/1000/snapd-session-agent.socket
73      /run/user/1000/systemd

进一步深入，发现/run/user/1000/libpod/tmp/占大头。因此直接重启服务器，正常了，此时是12时。

2023年12月19日晚上¶

bulletin-issues-transferred 容器状态异常，并且删除重建仍异常。最后sudo reboot了一下。

2023年12月10日上午¶

504 Gateway Timeout，但 dashboard 还能打开一点（清除 CDN 缓存后也 504），且 HTTP → HTTPS 正常，而且服务器还能正常收到一些请求。

HTTP/2.0 504 Gateway Timeout
accept-ranges: none
cache-control: no-cache
content-length: 15
content-type: text/plain
date: Sun, 10 Dec 2023 02:06:04 GMT
ohc-cache-hit: ts7un82 [1], qdix116 [0]
ohc-file-size: 15
server: JSP3/2.0.14
x-cache-status: MISS
x-error-info: External_SSLConnection

Gateway Timeout

原因不明。重启服务器，重置podman，重新安装证书，在docker-compose.yml中指明网络，然后就正常了。

2023年11月14日晚¶

11月起改用podman管理服务。

日常apt upgrade后，不小心用不规范的方法重启了 podman 服务（这既无必要也不合理），导致 podman 状态异常，无法完全工作。于是podman system reset，再重启各服务。重置也删除了缓存，找回所有缓存花了约 50 min。