PDF-Extract-Kit-1.0步骤详解：如何修改.sh脚本适配自定义PDF存储路径-平芜编程栈

PDF-Extract-Kit-1.0步骤详解：如何修改.sh脚本适配自定义PDF存储路径

你是不是也遇到过这样的情况：下载了一堆PDF文档，想用PDF-Extract-Kit-1.0自动识别表格、公式或分析页面布局，结果发现脚本默认只读取固定目录下的文件？改完PDF路径，一运行就报错“文件不存在”或者“Permission denied”？别急，这不是你的操作问题，而是脚本里藏着几个关键路径配置点——改对了，它就能乖乖读你指定位置的PDF；改错了，可能连环境都进不去。

这篇文章不讲抽象原理，不堆参数说明，就带你一行一行看懂PDF-Extract-Kit-1.0自带的四个核心.sh脚本（表格识别.sh、布局推理.sh、公式识别.sh、公式推理.sh），手把手教你定位、修改、验证路径逻辑。全程在4090D单卡镜像环境下实测，所有操作都在Jupyter终端中完成，不需要额外装包、不碰conda环境配置、不改Python源码——只动shell脚本本身。改完立刻生效，下次扔PDF到你自己的文件夹，双击运行就能出结果。

1. 先搞清楚PDF-Extract-Kit-1.0到底是什么

PDF-Extract-Kit-1.0不是某个大模型，而是一套轻量但实用的PDF内容提取工具集。它把PDF解析中几类高频需求拆成了独立模块：识别表格结构、理解页面元素排布（标题/段落/图片/页眉页脚）、检测数学公式区域、再用专用模型对公式做OCR识别。每个功能都封装成一个.sh脚本，背后调用的是PyTorch+PaddleOCR+LayoutParser等成熟组件，但对外只暴露最简单的命令行接口。

它的设计思路很务实：不追求“一键全搞定”，而是让你按需启用。比如你只关心电商商品PDF里的规格表格，那就只跑表格识别.sh；如果要处理学术论文，可能先跑布局推理.sh理清章节结构，再喂给公式识别.sh抓取LaTeX片段。这种模块化结构，也让路径定制变得非常清晰——每个脚本只管自己读哪、写哪、中间存哪。

更重要的是，它默认路径不是硬编码在Python里，而是写在.sh脚本开头的变量中。这意味着你不用动任何.py文件，只要改几行shell变量，就能让它完全听你指挥。

2. 理解PDF工具集的路径逻辑：三个关键位置

PDF-Extract-Kit-1.0的路径体系其实就围绕三个位置展开：输入PDF放哪、中间结果存哪、最终输出去哪。它们不是散落在各处，而是集中在每个.sh脚本最开头的几行变量声明里。我们以表格识别.sh为例，打开它你会看到类似这样的结构：

#!/bin/bash # ======================================== # PDF-Extract-Kit-1.0 表格识别脚本 # ======================================== INPUT_DIR="/root/PDF-Extract-Kit/data/input" OUTPUT_DIR="/root/PDF-Extract-Kit/data/output/table" MODEL_PATH="/root/PDF-Extract-Kit/models/table_model"

这三行就是全部关键。其他脚本（布局、公式）结构完全一致，只是变量名和路径略有差异。我们来逐个说清楚：

2.1 INPUT_DIR：PDF文件的“入口闸门”

这是脚本启动时第一个检查的位置。它决定了“哪些PDF会被处理”。脚本会用ls $INPUT_DIR/*.pdf列出所有PDF，然后挨个送进识别流程。如果你把PDF直接丢进这个目录，它能立刻识别；但如果你希望从/home/user/reports/或/mnt/nas/pdfs/读取，就必须改这里。

注意：这个路径必须是绝对路径，不能写./data/input或~/pdfs。因为脚本在后台被调用时，当前工作目录不一定是/root/PDF-Extract-Kit，相对路径容易失效。

2.2 OUTPUT_DIR：结果文件的“出口仓库”

识别完成后，表格结构（通常是JSON）、可视化标注图（PNG）、甚至带框的原PDF（PDF）都会存到这里。路径不存在时，脚本通常会自动创建；但如果权限不足（比如挂载的NAS目录没有写入权限），就会卡在保存环节。所以改完INPUT_DIR，一定要同步确认OUTPUT_DIR可写。

2.3 MODEL_PATH：模型文件的“粮仓”

虽然和PDF路径无关，但顺带提一句：这个路径指向模型权重文件。如果你后续想换更小的轻量模型或更新版本，改这里就行。默认路径下模型已预置好，首次使用无需改动。

3. 修改.sh脚本的四步实操法

现在我们进入正题：怎么安全、快速、可逆地修改路径？记住四个字：定位→备份→替换→验证。每一步都有明确命令，复制粘贴就能执行。

3.1 定位脚本位置并查看原始配置

先确认你当前在正确目录：

cd /root/PDF-Extract-Kit ls -l *.sh

你应该看到四个脚本：表格识别.sh、布局推理.sh、公式识别.sh、公式推理.sh。任选一个查看开头几行：

head -n 15 "表格识别.sh"

输出类似：

#!/bin/bash # ======================================== # PDF-Extract-Kit-1.0 表格识别脚本 # ======================================== INPUT_DIR="/root/PDF-Extract-Kit/data/input" OUTPUT_DIR="/root/PDF-Extract-Kit/data/output/table" MODEL_PATH="/root/PDF-Extract-Kit/models/table_model"

确认无误：路径变量都在前15行，格式统一，改起来毫无压力。

3.2 备份原始脚本（强烈建议！）

别跳过这步。万一改错，一句命令就能还原：

cp "表格识别.sh" "表格识别.sh.bak" cp "布局推理.sh" "布局推理.sh.bak" cp "公式识别.sh" "公式识别.sh.bak" cp "公式推理.sh" "公式推理.sh.bak"

所有备份文件名末尾都加了.bak，一眼可辨。如果后续想恢复，执行cp "表格识别.sh.bak" "表格识别.sh"即可。

3.3 替换为你的自定义路径

假设你想把PDF统一放在/home/user/my_pdfs/，结果存到/home/user/pdf_results/。执行以下命令（注意：sed命令中的路径要用单引号包裹，斜杠要转义）：

# 修改表格识别.sh sed -i 's|INPUT_DIR="[^"]*"|INPUT_DIR="/home/user/my_pdfs"|' "表格识别.sh" sed -i 's|OUTPUT_DIR="[^"]*"|OUTPUT_DIR="/home/user/pdf_results/table"|' "表格识别.sh" # 修改布局推理.sh sed -i 's|INPUT_DIR="[^"]*"|INPUT_DIR="/home/user/my_pdfs"|' "布局推理.sh" sed -i 's|OUTPUT_DIR="[^"]*"|OUTPUT_DIR="/home/user/pdf_results/layout"|' "布局推理.sh" # 修改公式识别.sh sed -i 's|INPUT_DIR="[^"]*"|INPUT_DIR="/home/user/my_pdfs"|' "公式识别.sh" sed -i 's|OUTPUT_DIR="[^"]*"|OUTPUT_DIR="/home/user/pdf_results/formula_detect"|' "公式识别.sh" # 修改公式推理.sh sed -i 's|INPUT_DIR="[^"]*"|INPUT_DIR="/home/user/my_pdfs"|' "公式推理.sh" sed -i 's|OUTPUT_DIR="[^"]*"|OUTPUT_DIR="/home/user/pdf_results/formula_recog"|' "公式推理.sh"

小技巧：sed -i直接修改文件，s|old|new|用竖线|代替斜杠/，避免路径中斜杠冲突；[^"]*匹配任意非引号字符，确保只替换引号内的路径。

改完后快速验证是否成功：

grep "INPUT_DIR\|OUTPUT_DIR" "表格识别.sh"

输出应为：

INPUT_DIR="/home/user/my_pdfs" OUTPUT_DIR="/home/user/pdf_results/table"

3.4 创建目录并赋予权限

脚本不会帮你创建父目录，也不会自动解决权限问题。手动补上这两步：

# 创建输入目录（放你的PDF） mkdir -p /home/user/my_pdfs # 创建输出根目录及各子目录 mkdir -p /home/user/pdf_results/table mkdir -p /home/user/pdf_results/layout mkdir -p /home/user/pdf_results/formula_detect mkdir -p /home/user/pdf_results/formula_recog # 赋予当前用户完全读写权限（关键！） chmod -R 755 /home/user/my_pdfs chmod -R 755 /home/user/pdf_results

至此，路径修改全部完成。接下来就是最让人安心的验证环节。

4. 验证修改是否生效：三分钟真机测试

别急着扔一堆PDF进去。先用一个最小闭环验证：放1个PDF → 运行1个脚本 → 检查结果。

4.1 放一个测试PDF

随便找一个PDF（比如官网下载的说明书），上传到你的新路径：

# 假设你已通过Jupyter上传功能把 test.pdf 放到了 /home/user/my_pdfs/ ls -l /home/user/my_pdfs/ # 应该看到：-rw-r--r-- 1 root root 1234567 Aug 10 10:20 test.pdf

4.2 运行修改后的脚本

激活环境，切换目录，执行：

conda activate pdf-extract-kit-1.0 cd /root/PDF-Extract-Kit sh "表格识别.sh"

你会看到滚动的日志，类似：

[INFO] 找到1个PDF文件：/home/user/my_pdfs/test.pdf [INFO] 正在加载模型... [INFO] 开始识别表格... [INFO] 识别完成，共检测到3个表格区域 [INFO] 结果已保存至：/home/user/pdf_results/table/test.json

如果看到/home/user/my_pdfs/和/home/user/pdf_results/出现在日志里，说明路径已生效。

4.3 检查输出结果

确认结果文件真实生成且可读：

ls -l /home/user/pdf_results/table/ # 应该看到：test.json, test_visualize.png, test_with_boxes.pdf # 查看JSON内容（确认是表格结构） head -n 20 /home/user/pdf_results/table/test.json

如果JSON里有"bbox"、"rows"、"cols"等字段，恭喜，你已经完全掌控了PDF-Extract-Kit-1.0的路径命脉。

5. 常见问题与避坑指南

实际操作中，有三个高频“卡点”，提前知道能省半小时：

5.1 报错“Permission denied”：不是脚本问题，是目录权限

现象：运行sh 表格识别.sh直接报错Permission denied，甚至不打印任何日志。
原因：/home/user/my_pdfs目录所有者是ubuntu用户，但你在root环境下运行脚本，root无权读取。
解法：用chown把目录所有权交给root，或统一用root用户上传PDF：

chown -R root:root /home/user/my_pdfs chown -R root:root /home/user/pdf_results

5.2 脚本运行后无输出：PDF后缀名不规范

现象：日志显示找到0个PDF文件，但目录里明明有report.PDF。
原因：Linux区分大小写，*.pdf不匹配*.PDF。
解法：统一重命名，或修改脚本中的匹配模式（推荐前者，更稳妥）：

# 批量把大写PDF改为小写 rename 's/\.PDF$/.pdf/' /home/user/my_pdfs/*.PDF

5.3 多个脚本共用同一输入目录，但输出互相覆盖？

现象：表格识别.sh和布局推理.sh都读/home/user/my_pdfs/，但布局推理.sh的输出也写进了table子目录。
原因：你只改了INPUT_DIR，忘了同步修改OUTPUT_DIR。
解法：严格按第3节方法，为每个脚本单独设置不同的OUTPUT_DIR子路径，如示例中所示。

6. 进阶建议：让路径管理更省心

当你处理的PDF越来越多，可以试试这两个小优化：

6.1 用符号链接统一入口

不想每次改四个脚本？建一个统一入口目录，用软链指向实际位置：

# 创建统一入口 mkdir -p /root/PDF-Extract-Kit/data/input_real # 把你的PDF目录链接过来 ln -sf /home/user/my_pdfs /root/PDF-Extract-Kit/data/input_real # 然后只改一个地方：所有脚本的 INPUT_DIR="/root/PDF-Extract-Kit/data/input_real"

这样以后换存储位置，只需改一行ln -sf命令，四个脚本自动同步。

6.2 在脚本开头加路径检查

防患于未然，在每个.sh脚本第一行#!/bin/bash下面加两行检查：

#!/bin/bash # 检查输入目录是否存在且可读 if [ ! -d "$INPUT_DIR" ] || [ ! -r "$INPUT_DIR" ]; then echo "[ERROR] 输入目录不存在或不可读：$INPUT_DIR" echo "请检查路径配置和权限设置。" exit 1 fi

下次路径写错，脚本会立刻报错并告诉你哪里不对，而不是默默失败。

7. 总结：你已经掌握了PDF-Extract-Kit-1.0的路径主动权

回顾一下，你完成了什么：

看懂了PDF-Extract-Kit-1.0的路径设计本质：三个变量控制全局IO；
学会了安全修改脚本的四步法：定位→备份→替换→验证；
实操了从创建目录、赋予权限到真机测试的完整闭环；
掌握了三个高频问题的速查速解方案；
还拿到了两个让长期使用更省心的进阶技巧。

从此，PDF-Extract-Kit-1.0不再是一个“只能读固定目录”的黑盒工具，而是你PDF工作流中可自由调度的一个环节。你可以把它接入NAS自动同步、对接企业网盘定时拉取、甚至写个简单Web界面让用户上传PDF——所有这些，起点都是今天你亲手改好的那几行路径。

下一步，试试把你的财务报表PDF扔进/home/user/my_pdfs/，运行sh 表格识别.sh，五分钟后，结构化JSON就在/home/user/pdf_results/table/里等着你导入Excel了。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

PDF-Extract-Kit-1.0步骤详解：如何修改.sh脚本适配自定义PDF存储路径