news 2026/5/12 20:05:37

论文16|Deep learning-based prediction of enzyme optimal pH and design of poi基于深度学习的酶最适 pH 预测及提高耐酸性的酶设计

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
论文16|Deep learning-based prediction of enzyme optimal pH and design of poi基于深度学习的酶最适 pH 预测及提高耐酸性的酶设计

目录

文献核心先览

01. 摘要

02. 引言

03. 结果

04. 结论


近日,在ACS Synthetic Biology期刊发表的论文Deep learning-based prediction of enzyme optimal pH and design of point mutations to improve acid resistance,通过构建名为 Seq2pHopt-2.0 的深度学习模型,解决了仅基于蛋白质序列预测酶最适 pH 精度低且缺乏可解释性的难题。该研究的创新点在于结合了大规模预训练蛋白质语言模型(ESM-2)、多尺度卷积神经网络和自注意力机制,不仅显著提高了预测准确性,还利用注意力权重揭示了关键残基信息,并成功指导了酶的耐酸性改造。

文献核心先览

1. 模型构建:开发了 Seq2pHopt-2.0 模型,利用 ESM-2 生成嵌入,结合多尺度 CNN 和自注意力机制,实现了从序列到酶最适 pH 的高精度预测。

2. 可解释性:模型具有良好的可解释性,能有效识别酶活性位点、结合位点以及对 pH 敏感的可电离残基。

3. 工程应用:基于模型预测,成功指导了Pyrococcus horikoshii二乙酰壳二糖脱乙酰酶的分子改造,H44C使其在酸性条件下的活性提高了约 7%。

01. 摘要

准确预测酶的最适 pH 对于定量描述 pH 如何影响酶催化活性至关重要。本研究开发的 Seq2pHopt-2.0 模型在性能上优于现有的酶最适 pH 预测工具,并且通过提供信息丰富的残基注意力权重表现出良好的可解释性。该模型在酸性和碱性酶的精确分类上展示了其作为酶挖掘工具的潜力,可用于识别具有特定 pH 偏好的候选酶。此外,在 Seq2pHopt-2.0 指导下设计的单点突变成功将Pyrococcus horikoshii二乙酰壳二糖脱乙酰酶在低 pH(pH=4.5/5.5)下的活性提高了约 7%,表明 Seq2pHopt-2.0 是一个有效针对 pH 依赖性酶活性的计算机辅助酶设计工具。

02. 引言

酶在食品发酵、废物转化和生物制造等工业过程中发挥着关键作用,而 pH 是影响酶构象和催化活性的重要因素。每种酶都有其达到最大催化速率的最适 pH,因此,开发精确的预测器对于酶的挖掘和工程改造至关重要。然而,由于实验测定成本高昂,数据库中存在大量未知最适 pH 的酶。虽然已有几种基于序列的机器学习模型,但大多仅能进行酸碱分类,或者是预测精度较低的回归模型(如 MeTarEnz)。

近年来,蛋白质语言模型的使用提升了预测精度,例如 EpHod 和 Seq2pHopt-1.0 分别利用 ESM-1 和 ESM-2 取得了进展。尽管后续出现的 OphPred 利用 XGBoost 进一步提升了精度,但这些模型普遍缺乏对蛋白质残基层面的可解释性,且尚未应用于实际的酶工程改造中。针对这些空白,本研究旨在构建一个兼具高精度和良好可解释性的深度学习模型 Seq2pHopt-2.0。

该研究不仅构建了模型,还通过案例研究展示了其在酶 pH 偏好性挖掘中的应用。利用该模型指导了Pyrococcus horikoshii二乙酰壳二糖脱乙酰酶的定向进化,验证了其作为计算工具在酶工程领域的实用价值。

03. 结果

1. 模型性能卓越

经过超参数优化,确定了 4 个注意力头和 4 个残差密集块的最佳配置。Seq2pHopt-2.0 在独立测试集上取得了 RMSE=0.833 和 R2=0.479 的优异成绩(图 2B)。在同等测试条件下,该模型优于前代模型 Seq2pHopt-1.0 (R2=0.369) 和 OphPred (R2=0.457)(图 2C)。特别是在极端 pH 范围(pH < 6 或 pH > 8)的预测上,Seq2pHopt-2.0 表现出比 OphPred 更低的均方根误差,说明其对极端酸碱环境酶的预测更为稳健(图 2D)。

2. pH 偏好性识别与生物体关联

模型能够有效区分酸性和碱性酶,以 pH 7.0 为界,分类准确率达到 91.8%(图 3B, 3C)。此外,研究还将预测范围扩展到微生物层面,发现模型能通过预测酶的最适 pH 分布来显著区分嗜碱微生物和嗜酸微生物(图 3D)。然而,在区分嗜酸微生物和嗜中性微生物时,预测值的分布差异并不显著,这提示微生物生长 pH 与其体内酶的最适 pH 之间的关系可能比预期的更为复杂(图 3F)。

3. 注意力机制揭示关键序列信息

通过分析残基注意力权重,研究发现中性和嗜碱酶在酸性/碱性残基上的注意力权重显著高于嗜酸酶,揭示了可电离残基的重要性(图 4A, 4B)。此外,活性位点和结合位点上的注意力权重显著高于其他普通残基(图 4C)。以甘露聚糖内切酶为例,其活性位点几乎都位于注意力权重的峰值附近(图 4D)。这证明 Seq2pHopt-2.0 并非“黑箱”,而是确实捕捉到了与酶催化功能密切相关的序列特征。

4. 指导酶耐酸性改造

在对 PhDac 的改造中,模型识别出野生型序列中的 44 位残基具有最高的注意力权重峰值,提示其为潜在的关键突变位点(图 5B)。基于模型预测筛选出的 5 个突变体中,H44C 和 H44D 成功实现了预期的耐酸性提升。与野生型(M20)相比,突变体 H44C 在 pH 4.5 和 5.5 下的酶活均提高了约 7%(图 5D)。这一结果不仅验证了预测的准确性,也展示了该模型在计算机辅助酶设计中的实际应用能力。

04. 结论

Seq2pHopt-2.0 是一个可解释的深度学习预测器,在酶最适 pH 预测方面展现了优于现有工具的精度。通过成功指导二乙酰壳二糖脱乙酰酶的耐酸性改造,该研究证明了 Seq2pHopt-2.0 在酶工程设计中的实用性。该工具将有望加速具有目标特性的酶的发现过程,并推动基于计算机设计的酶工程发展。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 20:33:16

34、内存管理与GDB调试

内存管理与GDB调试 1. 内存不足情况处理 1.1 标准内存分配策略 标准内存分配策略是过度提交(over-commit),即内核允许应用程序分配的内存超过物理内存。多数情况下,这能正常工作,因为应用程序通常会请求比实际需求更多的内存。这也有助于 fork(2) 的实现,因为设置了…

作者头像 李华
网站建设 2026/5/10 21:45:10

3步掌握n8n浏览器自动化:零基础搭建Puppeteer工作流

3步掌握n8n浏览器自动化&#xff1a;零基础搭建Puppeteer工作流 【免费下载链接】n8n-nodes-puppeteer n8n node for requesting webpages using Puppeteer 项目地址: https://gitcode.com/gh_mirrors/n8/n8n-nodes-puppeteer 想要实现网页自动化操作却担心编程门槛太高…

作者头像 李华
网站建设 2026/5/2 2:35:02

为什么90%的量子计算团队都在用VSCode做进度管理?真相曝光

第一章&#xff1a;VSCode 量子作业的进度跟踪在开发量子计算项目时&#xff0c;使用 Visual Studio Code&#xff08;VSCode&#xff09;作为集成开发环境能够显著提升编码与调试效率。配合 Q# 等量子编程语言插件&#xff0c;开发者可在本地或云端提交量子作业&#xff0c;并…

作者头像 李华
网站建设 2026/5/3 10:26:08

【VSCode Jupyter量子模拟全攻略】:掌握5大核心参数配置技巧

第一章&#xff1a;VSCode Jupyter量子模拟环境概述在现代量子计算开发中&#xff0c;集成开发环境&#xff08;IDE&#xff09;的配置直接影响研究与实验效率。VSCode 结合 Jupyter Notebook 插件&#xff0c;为量子模拟提供了直观、灵活且高效的编程平台。该环境支持 Python …

作者头像 李华
网站建设 2026/5/12 1:54:38

Context7 MCP Server实用指南:从新手到高手的快速上手

还在为LLM生成的代码过时而烦恼吗&#xff1f;Context7 MCP Server正是你需要的解决方案。这个工具能够为你的AI助手提供最新、最准确的代码文档&#xff0c;告别那些基于老旧训练数据的虚构API。本指南将用最简单的方式带你快速上手&#xff0c;避免那些让人头疼的技术术语。 …

作者头像 李华