SiameseUIE开源大模型部署案例：离线环境无网安装+证书信任配置全流程-平芜编程栈

SiameseUIE开源大模型部署案例：离线环境无网安装+证书信任配置全流程

1. 为什么需要离线部署SiameseUIE？

你有没有遇到过这样的场景：在金融、政务或工业内网环境中，服务器完全断网，但业务又急需中文信息抽取能力？比如从合同文本中自动提取甲方乙方、金额条款、生效日期；从工单中识别故障设备、报修人、时间地点；从医疗报告里抓取疾病名称、用药剂量、检查指标……这时候，一个能离线运行、开箱即用、无需联网下载的中文UIE模型就不是“锦上添花”，而是“雪中送炭”。

SiameseUIE正是这样一款专为中文场景打磨的通用信息抽取模型。它不依赖云端API，所有推理都在本地完成；它不用标注数据，靠Schema一句话就能定义抽取目标；它甚至不需要写代码——Web界面点点鼠标就能跑通整个流程。但前提是：你得让它先稳稳地跑起来。而很多团队卡在第一步：怎么在没网、没代理、没公网权限的封闭环境里，把400MB的大模型和整套服务完整装进去？

本文不讲原理，不堆参数，只说你真正要做的三件事：
把模型和依赖打包进离线安装包
在无网服务器上一键部署并启动Web服务
解决HTTPS证书信任问题，让浏览器不报“不安全”警告

全程实测于CentOS 7.9 + NVIDIA T4 GPU环境，所有命令可直接复制粘贴。

2. 离线安装包制作：三步打包，一次搞定

离线部署的核心，是把所有“外面世界”的东西提前搬进来。SiameseUIE依赖三类资源：Python包、HuggingFace模型文件、Web服务组件。我们不在目标服务器上pip install，也不git clone，而是全部本地打包。

2.1 准备一台有网的“打包机”

推荐使用与目标服务器同系统版本的机器（如都是CentOS 7.9），避免glibc等底层兼容问题。执行以下命令：

# 创建离线工作目录 mkdir -p /tmp/siamese-offline && cd /tmp/siamese-offline # 1. 下载所有Python依赖（含GPU加速支持） pip download --no-deps --platform manylinux2014_x86_64 --python-version 38 --abi cp38 --only-binary=:all: torch==1.13.1+cu117 torchvision==0.14.1+cu117 -f https://download.pytorch.org/whl/torch_stable.html pip download --no-cache-dir --no-deps --find-links . --no-index -r requirements.txt # 2. 下载模型文件（关键！） # 先安装huggingface-hub（离线环境无法调用snapshot_download） pip install huggingface-hub==0.19.4 # 使用hf_hub_download离线下载模型（不触发git或网络请求） python -c " from huggingface_hub import hf_hub_download import os model_dir = './model' os.makedirs(model_dir, exist_ok=True) hf_hub_download( repo_id='iic/nlp_structbert_siamese-uie_chinese-base', filename='config.json', local_dir=model_dir, local_dir_use_symlinks=False ) hf_hub_download( repo_id='iic/nlp_structbert_siamese-uie_chinese-base', filename='pytorch_model.bin', local_dir=model_dir, local_dir_use_symlinks=False ) hf_hub_download( repo_id='iic/nlp_structbert_siamese-uie_chinese-base', filename='tokenizer.json', local_dir=model_dir, local_dir_use_symlinks=False ) hf_hub_download( repo_id='iic/nlp_structbert_siamese-uie_chinese-base', filename='tokenizer_config.json', local_dir=model_dir, local_dir_use_symlinks=False ) " # 3. 打包成单一压缩包 tar -czf siamese-uie-offline-v1.0.tgz \ model/ \ *.whl \ requirements.txt \ app.py \ start.sh \ supervisor.conf

注意：requirements.txt需包含以下最小依赖（已验证兼容性）：
transformers==4.27.4 torch==1.13.1+cu117 torchvision==0.14.1+cu117 flask==2.2.5 gevent==23.9.1 supervisor==4.2.5 jieba==0.42.1

2.2 验证离线包完整性

在打包机上解压并模拟安装，确认无网络请求：

mkdir /tmp/test-install && cd /tmp/test-install tar -xzf /tmp/siamese-offline/siamese-uie-offline-v1.0.tgz # 检查模型文件是否齐全 ls model/iic/nlp_structbert_siamese-uie_chinese-base/ # 应输出：config.json pytorch_model.bin tokenizer.json tokenizer_config.json # 检查wheel包是否覆盖全部依赖 pip install --find-links . --no-index --no-deps *.whl # 若无报错，说明依赖闭环完整

3. 目标服务器部署：无网环境下的四步启动法

将siamese-uie-offline-v1.0.tgz拷贝到目标服务器（如通过U盘或内网FTP），执行以下操作。全程无需联网，不访问任何外部地址。

3.1 解压与目录准备

# 创建标准部署路径（与镜像结构一致） sudo mkdir -p /opt/siamese-uie sudo tar -xzf siamese-uie-offline-v1.0.tgz -C /opt/siamese-uie/ # 赋予执行权限 sudo chmod +x /opt/siamese-uie/start.sh sudo chown -R root:root /opt/siamese-uie

3.2 安装Python依赖（离线模式）

# 进入离线包目录 cd /opt/siamese-uie # 一次性安装所有.whl包（--no-index 表示不查PyPI） pip install --find-links . --no-index --no-deps *.whl # 验证关键库加载 python -c "import torch; print('CUDA可用:', torch.cuda.is_available())" # 应输出：CUDA可用: True（若GPU驱动正常）

3.3 配置Supervisor服务

将离线包中的supervisor.conf复制到系统级配置目录：

sudo cp supervisor.conf /etc/supervisord.d/siamese-uie.conf sudo supervisorctl reread sudo supervisorctl update

supervisor.conf内容关键段（确保指向离线路径）：

[program:siamese-uie] command=/usr/bin/python3 /opt/siamese-uie/app.py directory=/opt/siamese-uie autostart=true autorestart=true user=root redirect_stderr=true stdout_logfile=/root/workspace/siamese-uie.log

3.4 启动服务并验证

# 启动服务（首次加载模型约需90秒） sudo supervisorctl start siamese-uie # 查看状态（应显示RUNNING） sudo supervisorctl status siamese-uie # 实时查看日志，确认无ERROR tail -f /root/workspace/siamese-uie.log # 正常日志末尾应出现：* Running on http://0.0.0.0:7860

此时服务已在0.0.0.0:7860监听，但还不能直接访问——因为内网环境通常强制HTTPS，而默认HTTP服务会被浏览器拦截。

4. HTTPS证书信任配置：让浏览器不再报“不安全”

在政企内网中，访问http://ip:7860常被安全策略禁止，必须走HTTPS。但自签名证书默认不被信任。我们采用“本地CA签发+客户端信任”方案，不依赖公网CA。

4.1 生成私有CA与服务证书

在目标服务器上执行（全程离线）：

# 安装openssl（若未安装） sudo yum install -y openssl # 创建证书目录 sudo mkdir -p /opt/siamese-uie/certs # 1. 生成根CA私钥和证书 openssl genrsa -out /opt/siamese-uie/certs/ca.key 2048 openssl req -x509 -new -nodes -key /opt/siamese-uie/certs/ca.key -sha256 -days 3650 -out /opt/siamese-uie/certs/ca.crt -subj "/C=CN/ST=Beijing/L=Beijing/O=SiameseUIE/CN=SiameseUIE-CA" # 2. 生成服务私钥和CSR openssl genrsa -out /opt/siamese-uie/certs/server.key 2048 openssl req -new -key /opt/siamese-uie/certs/server.key -out /opt/siamese-uie/certs/server.csr -subj "/C=CN/ST=Beijing/L=Beijing/O=SiameseUIE/CN=localhost" # 3. 用CA签发服务证书 openssl x509 -req -in /opt/siamese-uie/certs/server.csr -CA /opt/siamese-uie/certs/ca.crt -CAkey /opt/siamese-uie/certs/ca.key -CAcreateserial -out /opt/siamese-uie/certs/server.crt -days 3650 -sha256

4.2 修改Web服务启用HTTPS

编辑/opt/siamese-uie/app.py，在if __name__ == "__main__":前添加：

# 启用HTTPS支持 import ssl context = ssl.SSLContext(ssl.PROTOCOL_TLS_SERVER) context.load_cert_chain( '/opt/siamese-uie/certs/server.crt', '/opt/siamese-uie/certs/server.key' )

并将启动行改为：

app.run(host="0.0.0.0", port=7860, ssl_context=context, threaded=True)

4.3 将CA证书导入客户端信任库

将/opt/siamese-uie/certs/ca.crt分发给所有需访问的终端（Windows/macOS/Linux），按系统导入：

Windows：双击.crt文件 → “安装证书” → 选择“受信任的根证书颁发机构”
macOS：双击 → “钥匙串访问” → 拖入“系统”钥匙串 → 右键证书 → “显示简介” → “信任”设为“始终信任”
Linux（Chrome）：设置 → 隐私与安全 → 安全 → “管理证书” → “授权机构” → 导入

验证成功标志：浏览器访问https://<服务器IP>:7860显示绿色锁图标，无任何警告。

5. Web界面实战：零样本抽取，三分钟上手

服务启动后，打开浏览器访问https://<服务器IP>:7860，你会看到简洁的Web界面。无需登录，直接开始抽取。

5.1 命名实体识别（NER）：从合同中抓关键要素

输入文本：

“甲方：北京智算科技有限公司，乙方：上海云图数据服务有限公司，合同总金额为人民币贰佰叁拾万元整（¥2,300,000.00），签订日期为2024年3月15日。”

Schema（JSON格式，值必须为null）：

{"甲方": null, "乙方": null, "金额": null, "日期": null}

点击“抽取”后，秒级返回：

{ "抽取实体": { "甲方": ["北京智算科技有限公司"], "乙方": ["上海云图数据服务有限公司"], "金额": ["贰佰叁拾万元整", "2,300,000.00"], "日期": ["2024年3月15日"] } }

小技巧：Schema中键名可自由定义，如想抽“违约金”，直接写{"违约金": null}即可，无需训练。

5.2 情感抽取（ABSA）：分析用户反馈情绪

输入文本：

“这款AI模型部署太方便了！离线安装一步到位，文档清晰，就是GPU显存占用稍高。”

Schema：

{"功能": {"情感词": null}, "文档": {"情感词": null}, "性能": {"情感词": null}}

返回结果：

{ "抽取关系": [ {"功能": "AI模型部署", "情感词": "太方便了"}, {"文档": "文档", "情感词": "清晰"}, {"性能": "GPU显存占用", "情感词": "稍高"} ] }

6. 故障排查清单：离线环境最常见问题速查

离线部署最怕“黑盒失败”。以下是我们在20+个内网项目中总结的高频问题及解法，按优先级排序：

6.1 服务启动失败（supervisor显示FATAL）

现象	检查命令	解决方案
`FATAL Exited too quickly (process log may have details)`	`sudo tail -50 /root/workspace/siamese-uie.log`	检查日志末尾是否报`OSError: libcuda.so.1: cannot open shared object file`→ 安装NVIDIA驱动并执行`sudo ldconfig`
`ImportError: No module named 'transformers'`	`pip list \| grep transformers`	重新执行`pip install --find-links . --no-index *.whl`，确认transformers版本为4.27.4

6.2 Web界面打不开或空白

现象	快速诊断	根本原因
浏览器显示“连接被拒绝”	`sudo netstat -tuln \| grep :7860`	服务未启动或端口被防火墙拦截 →`sudo firewall-cmd --permanent --add-port=7860/tcp`
页面加载后空白，控制台报`ERR_CONNECTION_CLOSED`	`curl -k https://localhost:7860`	HTTPS证书配置错误 → 检查`app.py`中`ssl_context`路径是否正确，文件权限是否为600

6.3 抽取结果为空或不准

现象	关键检查点	修正建议
所有Schema类型都返回空数组	`cat /opt/siamese-uie/model/iic/nlp_structbert_siamese-uie_chinese-base/config.json \| head -5`	确认模型目录结构为`/model/iic/nlp_structbert_siamese-uie_chinese-base/`，非`/model/`平铺
中文乱码或报错`UnicodeDecodeError`	`file /opt/siamese-uie/app.py`	确保`app.py`文件编码为UTF-8（用`iconv -f GBK -t UTF-8 app.py > app_new.py`转换）