《100个“反常识”经验02：磁盘满了我du找不到大文件？文件被删了空间却没释放》-平芜编程栈

📖 先唠两句

大家好啊，我是阿垚。

欢迎来到《100个“反常识”经验》第02期。

上期聊了SSH连不上，防火墙背了90%的锅。今天聊一个更诡异的问题：

磁盘满了，但du找不到大文件。

你是不是也遇到过——df -h显示使用率95%，但du -sh *加起来连一半都不到？

更离谱的是，明明把文件删了，磁盘空间却一点没变。

别急，今天带你找到真凶。

🤔 一个让我怀疑人生的下午

那天监控报警：某台生产服务器磁盘使用率飙到96%。

我登录上去，先执行了常规操作：

bash

df -h du -sh / 2>/dev/null | sort -hr | head -10

结果傻眼了：df显示用了180G，du加起来只有90G。

那90G去哪了？

我又去翻了/tmp、/var/log、~/.cache……都没有。

折腾了一个多小时，最后发现是什么？

有一个大文件被删了，但被某个进程还攥在手里，空间根本没释放。

这就是Linux里经典的“文件已删除，句柄未释放”问题。

🔧 为什么会出现这种情况？

简单解释一下原理：

当一个进程打开一个文件后，即使你在磁盘上把它删了（rm），只要进程还在运行，文件占用的空间就不会释放。

因为Linux的文件系统是通过inode引用计数来管理的。rm只是删掉了目录项，引用计数减1；但如果进程还持有这个文件，引用计数不会归零，空间就不会回收。

所以你会看到：文件没了，空间也没了。

📝 排错三步法（建议收藏）

第一步：确认是不是“幽灵文件”

执行以下命令，查看被删除但未释放的文件：

bash

lsof | grep deleted

或者更精确地只看文件大小：

bash

lsof | grep deleted | awk '{print $7, $9}' | sort -hr

如果看到一大堆(deleted)标记的文件，恭喜你，找到真凶了。

第二步：找到罪魁祸首进程

从上面输出里找到进程ID（PID），比如：

bash

java 12345 root 67r REG 8,1 10737418240 123456 /var/log/app.log (deleted)

这里PID是12345，是一个Java进程，删了一个10GB的日志文件但没释放。

确认一下进程在干什么：

bash

ls -l /proc/12345/fd/ | grep deleted

这会列出该进程所有还攥着的已删除文件。

第三步：释放空间（两种方法）

方法一：重启进程（推荐在业务低峰期）

bash

systemctl restart 服务名 # 或者直接 kill -9 12345 再重新启动

重启后，进程释放所有文件句柄，空间就回来了。

方法二：清空文件而不是删除（无需重启）

如果进程不能重启，可以这样操作：

bash

cat /dev/null > /proc/12345/fd/67

其中67是上面输出中的文件描述符编号。这条命令会清空那个文件，空间立即释放，进程继续运行。

⚠️ 注意：这个方法需要确认清空的文件确实是不需要的，别把正在写的重要数据清了。

💡 永久防范方案（别等磁盘满了再慌）

做完以上排查，我建议你再做四件事：

✅日志轮转配置好：使用logrotate，设置copytruncate选项，避免进程锁文件

✅监控文件句柄：添加告警，当lsof | grep deleted累计超过一定阈值时通知

✅应用日志规范：要求开发使用日志滚动框架（如Log4j的RollingFileAppender），别自己手写日志逻辑

✅定期巡检脚本：每周执行一次，检查是否有“幽灵文件”

bash

#!/bin/bash count=$(lsof 2>/dev/null | grep -c deleted) if [ $count -gt 0 ]; then echo "发现 $count 个未释放的文件句柄" lsof 2>/dev/null | grep deleted | head -10 fi

🔜 下期预告

《反常识03：服务器时间跳变导致K8s证书失效——凌晨3点的惊魂30分钟》

评论区聊聊你遇到过最诡异的磁盘问题。

——阿垚，一个踩过2万次坑的“老”IT

为什么你的Copilot总“忘记”上文逻辑？：深度拆解AST-aware上下文剪枝算法、控制流感知缓冲区、以及3种上下文衰减补偿策略

第一章：智能代码生成上下文理解优化 2026奇点智能技术大会(https://ml-summit.org) 现代大语言模型在代码生成任务中常因上下文建模粒度粗、语义边界模糊而产生逻辑错位或API误用。提升上下文理解能力，关键在于将代码结构、调用链路、依赖约束与用户意图…

李华

从原子到电路：PN结单向导电性的微观物理与宏观应用

1. 从原子到PN结：半导体世界的奇妙之旅想象一下，你手里拿着一块纯净的硅晶体。在微观世界里，每个硅原子都伸出四只"手"（价电子），与相邻的原子紧紧相握（共价键）。这种稳定…

李华

NXP S32G开发第一步：手把手教你搞定EB tresos AutoCore下载与在线激活（附官网截图）

NXP S32G开发环境搭建实战：从零开始掌握EB tresos AutoCore配置全流程第一次接触NXP S32G芯片和AUTOSAR开发环境的工程师，往往会在环境配置阶段遇到各种"拦路虎"。本文将带你完整走通EB tresos AutoCore工具的获取、安装与激活全流程&#xf…

李华

从‘无法定位程序入口’到一键部署：手把手教你配置VS2022+QT项目的发布环境（含海康相机SDK特例）

从‘无法定位程序入口’到一键部署：VS2022QT项目发布环境全攻略当你在本机完美运行的QT项目，到了客户电脑上却频频弹出"无法定位程序输入点"或"DLL缺失"的错误时，那种挫败感每个开发者都深有体会。特别是集成第三方SDK&…

李华

选择排序：简单高效的排序入门

前言选择排序是一种简单直观的排序算法，通过不断选择剩余元素中的最小值，将其放到已排序部分的末尾。与冒泡排序相比，选择排序的交换次数更少，但不稳定。算法步骤从数组的第一个元素开始，遍历整个数组，找到…

李华

告别AHRS调参噩梦：手把手教你用VQF算法搞定IMU姿态解算（附Matlab/Python代码）

VQF算法实战指南：零调参实现高精度IMU姿态解算在嵌入式系统和机器人开发中，姿态解算一直是工程师们面临的棘手问题。传统算法如Mahony和Madgwick虽然广为人知，但其繁琐的参数调优过程常常让人望而却步。本文将带你深入了解VQF算法——一种开…

李华