MutComputeX 是一个强大的基于 3D 深度学习的蛋白质工程工具,能够预测蛋白质-配体界面的突变。然而,官方文档主要针对 AMD 显卡(ROCm平台)进行了配置,对于使用普通 NVIDIA 显卡或仅使用 CPU 的用户来说,直接安装往往会报错。
本文将手把手教你在通用的 Linux 服务器环境下部署 MutComputeX。
一、前置准备
系统:Linux (Ubuntu/CentOS)
工具:Conda (Anaconda 或 Miniconda), Git
硬件:NVIDIA GPU 或 CPU(本文针对非 AMD 显卡环境进行了适配)
二、安装教程
1、获取代码库
首先,将项目代码克隆到本地服务器:
git clone https://github.com/danny305/MutComputeX.git cd MutComputeX2、修改依赖配置
官方默认依赖tensorflow-rocm,这是专为 AMD 显卡设计的。如果你使用的是 NVIDIA 显卡或者只想用 CPU 运行,必须修改此项,否则无法安装或运行。
(1)打开依赖文件:
vim requirements.txt(2)找到包含tensorflow-rocm的行,将其修改为标准的tensorflow:
修改前:
tensorflow-rocm==2.9.1修改后:
tensorflow==2.9.1
(3)保存并退出 (:wq)
3、创建并激活虚拟环境
为了避免环境冲突,我们使用 Conda 创建一个独立的 Python 3.8 环境:
# 创建名为 mutcomputex 的环境 conda create -n mutcomputex python=3.8 -y # 激活环境 conda activate mutcomputex # 安装修改后的依赖 pip install -r requirements.txt4、安装 AWS CLI 工具
MutComputeX 的模型权重和测试数据存储在 AWS S3 上,因此必须安装awscli才能运行下载脚本。
# 推荐使用 pip 安装 pip install awscli # 或者使用 conda 安装 conda install -c conda-forge awscli证安装:输入aws --version,若显示版本号则安装成功。
5、设置环境变量
这是最容易卡住的地方。如果不将当前目录加入PYTHONPATH,运行脚本时会报错ModuleNotFoundError: No module named 'MutComputeX'。
在项目根目录 (MutComputeX/) 下执行:
export PYTHONPATH=$(pwd)注意:该命令只在当前终端窗口有效。建议每次打开新终端准备运行时,都先执行这一句,或者将其写入环境变量。
6、下载模型权重
代码库本身不包含模型文件,需要手动运行脚本下载:
cd models chmod +x download_models.sh ./download_models.sh cd .. # 下载完成后返回根目录7、下载测试数据与运行
我们使用官方提供的Norbelladine 4-O-methyltransferase案例来验证环境是否搭建成功。
(1)下载测试数据
cd data/norbelladine_4OMTase/boxes ./download_dataset.sh(2)运行预测脚本
我们需要回到scripts目录来执行预测:
# 回到项目根目录后进入 scripts cd ../../../scripts # 运行预测 python generate_norbelladine_predictions.py三、运行结果解读
当你看到类似下面的输出时,说明正确安装并执行成功了:
Loaded data: (478, 9, 20, 20, 20) Generating predictions with model - resnet-k05... 15/15 [==============================] - 7s 320ms/step ... Wrote predictions: .../data/norbelladine_4OMTase/predictions/4OMTase_dataset_predictions.csv常见问题:
Q: 屏幕上出现了很多红色的
W tensorflow/...报错?
A:如果你没有配置 GPU,TensorFlow 会提示找不到显卡并自动切换回 CPU 模式,或者提示数据分片(Sharding)警告。只要程序没有中断并最后生成了 CSV 文件,这些红字可以忽略。
Q: 提示
aws: command not found?
A:请回到第四步,确保安装了
awscli并且在当前环境中可用。