news 2026/5/30 23:51:18

NC | rhizoSMASH预测植物相关细菌中与根际适应性相关的分解代谢

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
NC | rhizoSMASH预测植物相关细菌中与根际适应性相关的分解代谢

点击蓝字 关注我们

Nature Communications | 利用 rhizoSMASH 预测植物相关细菌中与根际适应性相关的分解代谢基因簇

研究论文

  • DOI:

    https://doi.org/10.1038/s41467-025-63526-8

  • 原文链接:

    https://www.nature.com/articles/s41467-025-63526-8

  • 第一作者:Yuze Li

  • 通讯作者:Marnix H. Medema (marnix.medema@wur.nl)

  • 主要单位:

    中国农业大学资源与环境学院、河北曲周农业绿色发展观测研究站、荷兰瓦赫宁根大学生物信息学组、荷兰皇家艺术与科学学院国家植物生态与土壤研究所、莱顿大学生物学研究所、瓦赫宁根大学森林生态与森林管理组

摘要Abstract

植物将其光合作用产生的碳中相当大一部分以根系分泌物形式释放到根际环境中,从而驱动微生物群落的形成。由于目前尚无专门的计算方法能系统地识别微生物对根系分泌物的代谢途径,因此揭示植物如何通过根系分泌物调节根际微生物群落的组成和活性仍是一项挑战。在此,我们整合了关于参与细菌根际适应性的代谢基因的已发表信息,开发了rhizoSMASH算法,该算法基于基因组同源性,利用58条经过精心设计的检测规则,对细菌中的根际适应性相关代谢基因簇(rhizosphere-competence-related catabolic gene clusters, rCGCs)进行注释。分析结果揭示,rCGC的分布在植物相关细菌类群之间及内部均存在异质性,表明其具有广泛的生态位特化性。此外,我们通过两个案例研究,在机器学习中验证了rCGC的存在与否对根际适应性的预测价值。rhizoSMASH为研究根际细菌的代谢过程提供了一个可扩展的框架,有助于推动微生物组辅助育种方法在可持续农业中的应用。

结果Results

rhizoSMASH 的开发

Development of rhizoSMASH

我们推出了rhizoSMASH算法的首个可运行版本,该算法用于预测细菌基因组中的rCGC。作为antiSMASH软件家族的一员,rhizoSMASH同样通过一套检测规则来预测基因簇。每条规则都描述了由轮廓隐马尔可夫模型捕获的功能域组合(图1a,更多细节请参见“方法”部分)。

图1 rhizoSMASH 的开发

a rhizoSMASH的基因簇预测工作流程。rhizoSMASH以基因组序列文件(GenBank或FASTA格式)作为输入,通过扫描序列特征的隐马尔可夫模型来识别潜在的分解代谢酶。随后,利用一套检测规则检测编码相关代谢途径的基因簇。b 用于rCGC检测规则整理的调整流程。

首先,通过全面的文献研究总结出一套初始检测规则。随后,使用这套检测规则对 BARS 数据集中的基因组序列进行扫描。利用 BiG-SCAPE 结合已知的基因簇数据库 rKnownCGCs,将输出的基因簇分组为基因簇家族。我们通过目视检查BiG-SCAPE生成的基因聚类家族网络,手动对检测规则进行校准,以识别潜在的假阳性/假阴性结果,并在必要时借助进一步的文献检索。这一校准、验证和微调过程共进行了三次,以逐步获得更优的检测规则。由BioRender.com制作。

rhizoSMASH 的开发始于一套初始检测规则,这些规则是根据文献中具有遗传和/或生化功能证据的已知 rCGCs 总结而来的(补充图 1、补充表 2)。随后,通过序列相似性网络分析对检测规则进行了三轮人工校准,以提高其预测准确性。校准基于对检测到的基因簇家族的详细文献指导评估,以识别假阳性和假阴性(图 1b,最终验证结果可参见 https://www.bioinformatics.nl/~li286/rhizosmash-demo,更多细节见“方法”部分)。最终集包含 58 条检测规则,涵盖了可降解根部分泌物中常见的六类底物的代谢途径,即碳水化合物、有机酸、氨基酸、胺、植物激素和芳香族化合物。关于这些底物的说明、其在细菌中的降解过程、已知 rCGC 的实例,以及它们在根际适应性中的相关性证据,均记录在 https://www.bioinformatics.nl/~li286/rhizosmash-doc 中。

在 rhizoSMASH 的工作版本中,我们主要关注可溶性初级代谢物的分解代谢途径(除少数例外)。然而,已有研究表明,大分子、植物来源的多糖、挥发性化合物以及植物物种特异性次级代谢物也会影响根际细菌与植物之间的相互作用。RhizoSMASH是一款可扩展的软件,与antiSMASH家族的其他成员类似,未来版本中将添加更多基于上述代谢物谱的、涵盖分解代谢途径的检测规则。

土壤和根际细菌中rCGC谱系的多样性

Diversity of rCGC profile in soil and rhizosphere bacteria

我们构建了一个包含1,226个来自根际和土壤细菌(BARS文库,详见“方法”部分及补充表1)的基因组组装库,以研究rCGC在细菌分类学中的分布情况。这些基因组在rCGC的存在/缺失模式上既表现出类群间的差异,也呈现出类群内的多样性(补充图2)。我们汇总了BARS集合中至少包含8个完整组装基因组的20个细菌科中每种rCGC类型的普遍存在情况(图2a)。结果显示,若干rCGC类型在几乎所有细菌科中均具有高流行率(例如,谷氨酸合成酶glt簇,79.3%;谷氨酰胺合成酶gln簇,93.6%),这表明这些基因簇可能编码在绝大多数根际细菌基因组中存在的、在代谢中发挥基础作用的途径。其他 rCGC 类型则仅存在于有限的分类群中:L-脯氨酸降解 put 簇几乎仅存在于假单胞菌门(以前称为变形菌门)和少数杆菌门(以前称为厚壁菌门)基因组中,而 D-脯氨酸消旋酶途径 prd 簇几乎仅限于梭菌科。一些编码相同底物代谢途径的基因簇类型,如蔗糖水解酶、磷酸化酶和左旋糖蔗糖酶旁路途径,在分类学上具有重叠的分布。然而,对于其他一些情况,例如海藻糖磷酸转移酶和海藻糖酶途径,它们表现出互补的分布模式,这表明不同分类群之间存在生态位分化(φ=−0.27,费希尔精确检验,P=4×10^(−7))。需注意,基因组中未检测到 rCGC 并不一定意味着该基因组不携带任何编码该通路的基因;在极少数情况下,这些基因可能分散在基因组中,因此无法被 rhizoSMASH 识别为基因簇。此外,由于 rCGC 的检测规则是基于已知研究设计的,因此可能还存在由未记录基因簇编码的分解代谢通路。

图2 rCGCs在细菌分类学中的分布

a 细菌科中rCGC的检出率。圆点的大小代表该科中被rhizoSMASH检测到某类rCGC的基因组所占的比例(正文中定义为检出率)。左侧的系统发育树基于NCBI提供的谱系信息构建。括号中的数字表示BARS数据库中各科已完全组装的基因组数量。b 细菌各科中rCGC类型的丰富度(某科基因组中存在的rCGC类型平均数量)以及c 多样性(某科内每对基因组间rCGC存在/缺失情况的平均差异)指标。d 分离来源明确的诺卡菌科(Nocardiaceae)物种基因组中rCGC的存在/缺失分布图,其中实心圆点表示基因组中存在某种rCGC类型,空心圆点表示缺失。右侧标签代表分离来源,依据JGI GOLD和NCBI的记录。左侧系统发育树基于基因组16S rDNA序列构建,以假单胞菌(Psedomonas putida)模式菌株NBRC 14164作为外群(树上未显示)作为根节点。

对 20 个细菌科的 rCGC 丰度进行非度量多维尺度分析(NMDS)(补充图 3)显示,分类学上相关的科具有相似的 rCGC 谱系(零假设的 PERMANOVA 分析:各科的 rCGC 丰度在所有门中均相同,P = 0.001)。具体而言,杆菌门(Bacillota)基因组中含有更多的与碳水化合物代谢相关的rCGC(Wilcoxon检验,P=0.0219;见图2a和补充图3中的杆菌门区域),这与先前关于细菌中碳水化合物活化酶分布的系统发育研究结果一致。相比之下,芳香族化合物和植物激素降解相关的 rCGC 在假单胞菌门和放线菌门中更为常见(Wilcoxon 检验,P < 2.2 × 10−16;见图 2a 和补充图 2 中的相应扇区)。事实上,大多数已知的细菌芳香族代谢途径,以及auxin的生物合成和降解途径,均在上述两个门类中被鉴定出来。

随后,我们希望从更广泛的分类等级缩小到每个细菌科。为此,我们首先调查了每个科中 rCGC 类型的丰富度和多样性(详细定义见“方法:rCGC 的科级分布”),如图 2b、c 和补充图 2 所示。结果表明,rCGC 丰富度最高的科通常属于假单胞菌门。在假单胞菌门(Pseudomonadota)中,伯克霍尔德菌科(Burkholderiaceae)和假单胞菌科(Pseudomonadaceae)的基因组中具有最高的rCGC类型丰富度和多样性,这表明这些微生物中的许多是代谢通才,能够利用多种根系分泌物成分生长。这两个科还经常作为最优势的细菌科成员出现在各种根际微生物群落中。特别是假单胞菌科,其中包含大量已知的促植物生长根际菌株。相比之下,脱硫杆菌科、李斯特菌科和军团菌科的基因组在 rCGC 类型方面表现出最低的丰富度和多样性(图 2b、c、补充图 2)。这些科在根际中通常并不丰富:脱硫杆菌科(Desulfitobacteriaceae)的细菌是严格厌氧的硫酸盐或有机卤化物还原菌,常见于缺氧沉积物中;李斯特菌科(Listeriaceae)和军团菌科(Legionellaceae)的成员则被认为是食源性或环境病原体。这三个科的所有基因组条目都属于 RefSoil 子集合,这表明根据映射到其 16S rDNA 序列的宏基因组读取数据,它们存在于各种土壤样本中,但对这些菌株的详细检查表明,它们中没有一种最初是从包括根际在内的植物相关环境中分离出来的(补充表 3)。这些结果表明,与适应植物以外生态系统的细菌相比,根际细菌携带的rCGCs更为丰富且多样。

随后对诺卡菌科(Nocardiaceae)的重点研究表明,该科在所有受测科中具有最高的rCGC类型多样性(图2a、d),这表明该科的成员可能具有不同的代谢策略以适应其当地环境。本研究中的诺卡菌科菌株最初分离自各种生态系统,包括人类患者、土壤、根际和根部(补充表 3),这一点在其系统发育树中得到了体现(图 2d)。总体而言,与临床诺卡菌科菌株相比,环境菌株往往携带更多的 rCGC 类型(Wilcoxon 检验,P = 0.018)。源自土壤的菌株富含芳香族化合物降解途径(图2d),这使它们能够利用土壤中丰富的木质素衍生物。多项研究已报道诺卡菌科物种中存在auxin代谢途径。RhizoSMASH 还预测了一组编码auxin生物合成和降解途径的假定rCGCs,这些基因簇在环境菌株中富集(图2d),包括苯乙酸降解的paa簇68和吲哚-3-乙酸(IAA)到儿茶酚的iac基因簇。据报道,在其他 Rhodococcus 菌株中,醛氧肟脱水酶基因簇(由 IAA 生物合成 IAN 途径规则检测到)对吲哚-3-醛氧肟 (IAOx) 也具有一定程度的底物特异性。rCGC 在该科内的这种多样性表明,相关的分解代谢在适应不同环境方面起着重要作用。

进一步放大到亚基因组水平,我们还观察到 rCGC 在各种细菌基因组中的分布不均(补充图 4)。它们形成了富含 rCGC 的亚染色体区域,包括编码彼此下游或上游代谢途径的 rCGC(例如,苯甲酸代谢基因簇及其下游的儿茶酚 2,3-裂解基因簇),这表明它们可能形成基因岛(GI),通过协同的水平基因转移促进快速生态位适应,尽管我们尚未获得明确的统计证据来支持这些富含rCGC的区域与tRNA基因(作为GI标志物之一,见补充图4)之间的关联。为了进一步研究rCGC的基因组内多样性,我们重点研究了伯克霍德菌属(Burkholderia),该属通常具有多片段基因组,包含三个大型环状复制子。这些复制子的命名在不同的研究领域中各不相同,在本研究中,我们根据它们在每个基因组中的序列长度(由长到短)将其分为“染色体”、“染色体片段”和“巨质粒”三种类型。我们使用 NMDS 在 BARS 中分析了完全组装的伯克霍德氏菌基因组中的所有复制子,并利用了每个复制子序列中的 rCGC 存在/缺失谱(图 3a)。结果显示,来自不同基因组的染色体、染色体片段和巨质粒是根据其类型而非来源基因组聚类在一起的,这表明某些 rCGC 类在同一复制子类型内的定位并非随机(图 3a)。方差置换分析也证实,染色体、染色体片段和巨质粒之间的 rCGC 存在/缺失谱存在显著差异 之间存在显著差异(PERMANOVA;P=0.001),但在不同基因组来源(P=1.00)或物种(P=0.985)之间则无显著差异。同时,具有不同底物类别的rCGCs也表现出对一或两个复制子的显著偏好(图3b、c)。例如,与染色体相比,芳香族化合物rCGCs在巨质粒和染色体质粒中富集,这与先前研究中报道的复制子功能偏好一致。由于次级复制子(染色体质粒和巨质粒)的进化速率更快,rCGCs在染色体质粒和巨质粒中的富集表明它们在环境适应中具有重要作用。

图3 伯克霍德菌属复制子中rCGC的偏向性分布

根据各复制子序列中rCGC的存在与否,绘制了伯克霍德菌属(Burkholderia spp.)复制子的NMDS图。每个点代表一个菌株中的复制子,而点的颜色则代表复制子的类型(根据其序列长度手动标注)。椭圆代表每种复制子类型的1个标准差(1-SD)范围。每个三角标记代表一种rCGC类型,其颜色依据图2中使用的相同方案进行标注。b 每种复制子类型中每百万碱基所含rCGC的平均数量(误差条长度=1-SD)。P值来自针对三种复制子类型均等性的Kruskal-Wallis秩和检验结果。c 与(b)类似,但根据底物特性将rCGC类型分为六类。P值采用Bonferroni法进行了多重检验校正。

到目前为止,我们已分析了不同分类学和亚基因组水平上rCGC的多样性。研究结果表明,细菌基因组中rCGC谱系的差异与其生活方式有关。因此,我们提出假设:可以通过细菌基因组中rCGC的存在/缺失谱系来预测其根际适应能力。为了验证这一假设,我们开展了两项案例研究。

利用基因组rCGC谱预测根际适应性

Predicting rhizosphere competence with genomic rCGC profiles

许多研究试图通过各种方法和特征来预测根际适应性。代谢组学分析、全基因组功能注释或基于合成微生物群落的实验研究为预测细菌群落的根际行为铺平了道路,并揭示了特定代谢活性或基因与宿主特异性之间的明确关联。然而,这些方法大多相当费时费力,且尚未建立根系分泌物组成与相关微生物代谢途径基因之间的直接功能联系。在此,我们利用其中两项研究,以证明 rhizoSMASH 在基于 rCGC 谱系推进根际适应性分析方面的价值。

在首个案例研究中,我们采用了 Zboralski 等人在 2020 年发表的 60 株苯并吡嗪产生假单胞菌(Pseudomonas spp.)的代谢能力数据(通过 Biolog 表型微阵列测定)及其在拟南芥和马铃薯根际的定殖数据(更多细节见“方法”部分)。根据基因组rCGC谱和实验测定的分解代谢能力进行的NMDS分析显示,不同根际定殖水平的菌株呈现分离趋势(图4a)。PERMANOVA分析进一步证实,无论是rCGC谱还是代谢能力,高定殖型与低定殖型菌株之间(PrCGC=0.001,Pcat=0.001),以及中定殖型与低定殖型菌株之间(PrCGC=0.001,Pcat=0.001)均存在显著差异,但在高定殖型与中定殖型菌株之间未见显著差异(PrCGC=0.354, Pcat=0.061)。因此,在后续分析中,我们将“高”和“中”两个根际定殖能力水平合并为“中高”一类。随后,我们训练了随机森林模型,以预测拟南芥和马铃薯根际中的定殖水平,分别以代谢能力或rCGC谱作为预测变量(下文分别称为基于代谢的模型和基于rCGC的模型)。根据8折嵌套交叉验证的结果,对于拟南芥的根际定殖,基于rCGC的模型预测准确率为0.884(标准差=0.106),而基于代谢途径的模型准确率为0.848(标准差=0.115)(图4c)。对于马铃薯的根际定殖,基于 rCGC 的模型和基于代谢的模型的预测准确率分别为 0.783(标准差 = 0.122)和 0.681(标准差 = 0.110)(图 4d)。总体而言,基于 rCGC 谱系训练的模型至少与基于实验测得的代谢能力训练的模型一样准确(图 4cd)。

图4 利用rCGC谱系预测根际适应性

a 根据第一项案例研究(假单胞菌属分离株)的代谢测定结果或基因组rCGC存在/缺失谱绘制的细菌菌株NMDS图;b 根据第二项案例研究(地中海草地土壤细菌分离株)的相应数据绘制的NMDS图。每个点代表一个细菌菌株,其中颜色表示根际适应性,形状表示其在(a)中的假单胞菌亚群及在(b)中的门分类。图(b)中,来自同一菌株的重复测量数据通过连接数据点的线表示。c–e 基于不同数据集构建的预测模型,通过交叉验证估算的准确率。柱高代表来自8个交叉验证折叠的平均准确率。十字符号表示每个折叠中估算的准确率(误差条长度=1-SD)。底部标签标明了预测变量和植物根际的类型。需注意,地中海草地数据集中的基于代谢产物的模型(右侧组中的橙色柱)采用不同的交叉验证设置进行评估,因为该外代谢物谱数据集虽包含重复观测,但涉及的菌株数量较少。f 针对Avena barbata案例研究中16个已测定外代谢物谱的菌株所预测的分类概率。条形高度代表样本外预测的根际共生能力为正的概率(青绿色:基于rCGC的模型,橙色:基于代谢的模型)。十字符号代表每次重复测量的预测概率。

在第二个案例研究中,我们利用Zhalnina等人于2018年发表的数据集,扩大了细菌的分类范围。该数据集包含Avena barbata根际共生能力数据,虽然仅涉及39株细菌分离株,但与第一个案例研究相比,其涵盖的门类范围更为广泛。该数据集还包含16个菌株子集的根系分泌代谢物摄取谱,这些数据通过外源代谢物谱分析获得,每个菌株有2至4个有效的重复测定(更多细节见方法部分)。对于这组更具多样性的菌株,无论依据rCGC谱还是根系分泌代谢物摄取数据,NMDS图均未显示根际适应性水平的明显分离(图4b),且PERMANOVA分析结果同样表明,在阴性与阳性根际响应组之间,无论是rCGC谱(Jaccard指数下PrCGC=0.128)还是根分泌代谢物摄取谱(二项式指数下Pcat=1.00,按细菌分离株标签分层分析),均未发现显著差异。我们还利用基因组rCGC谱或根系分泌代谢物摄取谱(为方便起见,下文分别称为“基于代谢”模型和“基于rCGC”模型),训练了用于预测细菌分离株根际适应性的随机森林模型。对于基于rCGC的模型,我们实现了0.729的准确率(标准差=0.177),这在假单胞菌限定案例中低于基于rCGC的模型(图4c–e)。对于基于代谢途径的模型,我们仅获得了0.577(标准差=0.169)的准确率(图4e),且对重复测量的预测结果进行平均处理并未提高其准确率(0.542,标准差=0.173,图4f)。

总体而言,与前一个案例研究相比,我们在第二个案例研究中观察到的预测准确率较低。一个显而易见的解释是,模型训练中可用的(独立)观测数据数量较少(60 例 vs. 39 例或 16 例)。我们采用的分组交叉验证方法(详见“方法”部分)考虑了外代谢物谱数据中重复测量之间的相互依赖性。若未进行适当处理,这可能会导致预测准确率被高估。例如,在本研究中,使用内置的“留一法”(OOB,该方法未考虑样本依赖性)对Avena barbata的基于分解代谢的模型进行评估时,其预测准确率高达95.6%。这也解释了为什么我们的交叉验证准确率无法与 Zhalnina 等人的原始研究中主成分回归(PCR)模型的学习曲线所暗示的准确率相提并论,该研究同样未对此进行校正。

我们在交叉验证中利用样本外预测评估了模型的性能指标(补充表 4)。所有模型的敏感性值均高于 0.8,但只有拟南芥模型的特异性值达到(或高于)0.8。一种可能的解释是,相比自然界中其他细菌群体的多样性,根际适应性细菌的组成更为单一,而我们的训练数据可能未能充分捕捉到这种变异性。我们还比较了每对基于rCGC和基于代谢途径的模型在样本外预测概率上的差异(补充图6、图4f)。总体而言,这两种模型的预测结果基本一致(拟南芥模型:相关系数 Cor = 0.964,P < 2.2 × 10−16;马铃薯模型:Cor = 0.796,P = 1.5 × 10−14;A. barbata 模型:Cor = 0.560,P = 0.012)。然而,对于某些模型,根际适应性较低的菌株其预测一致性有所下降,具体表现为马铃薯模型中的低定植菌株(相关系数Cor=0.560,P=0.012)以及A. barbata模型中的负响应菌株(相关系数Cor=0.304,P=0.348),这与观察到的较低特异性相一致。此外,我们还利用模型对4株显示出非显著性根际反应的菌株进行了预测,Zhalnina等人曾使用这些菌株来验证其PCR模型(图4d,灰色区域)。尽管本研究中的两个模型给出了一致的预测结果,但这些结果与Zhalnina等人发表的PCR模型并不一致。

通过比较变量重要性的排名(补充图 4),我们发现,对于在基于 rCGC 的模型中具有较高预测值的 rCGC,如果其底物或相关代谢物在降解数据中存在,它们通常也会出现在相应的基于降解的模型的重要变量列表中。这些匹配的变量对包括半纤维素成分木糖、生长素苯乙酸、生物源单胺苯乙胺,以及抗坏血酸降解下游的有机酸苏氨酸(补充图 4)。在第一个案例研究中,木糖降解 rCGC 出现在拟南芥和马铃薯预测模型的前 10 个重要变量中,而苯乙酸降解 rCGC 则出现在所有三种植物的前 10 个重要变量中。木糖被发现是多种植物物种的种子、幼苗和根系渗出液中的主要糖类之一,尽管苯乙酸在根系渗出液中并不丰富,但其生物前体苯丙氨酸也是多种植物根系渗出液中的核心代谢物之一。我们的研究结果表明,它们在介导根际定殖过程中的作用可能在许多植物中具有普遍性。相比之下,某些代谢物具有植物特异性的预测价值,例如在A. barbata研究中发现的L-脯氨酸,该物质也被鉴定为植物生长第6至9周期间分泌量升高的代谢物之一4。作为细菌和植物中重要的渗透调节物质,已有研究报道L-脯氨酸及其代谢下游产物可介导根际细菌依赖性的抗旱性。但需指出的是,随机森林模型中重要性值的高波动性并不总是意味着正相关,且本案例研究数据集的规模有限,难以得出过于普遍的结论。

此外,这两个数据集中的细菌菌株在根际适应性方面表现出明显的系统发育偏向(图4a、b,点形状)。特别是在第二个案例研究中,杆菌门、假单胞菌门和酸杆菌门属的菌株在根际响应中呈现出完全正向或完全负向的特征。这种偏差使得基于简单分类学的预测在两个数据集上也表现良好(图4c–e,灰色柱状图)。总体而言,我们认为,在预测根际适应性时,不应仅将分解代谢基因簇谱作为唯一依据,因为其他因素(如移动性、生物膜形成、抗生素生物合成和植物免疫反应)也会影响根际适应性的确定,但数据表明,这些谱确实包含具有显著预测价值的信息。

毕竟,即使在缺乏任何分类学信息的情况下,仅基于极少数二元特征,也能以相对较高的精度预测根际适应性(图4c–e)。将rhizoSMASH结果与宏基因组和/或宏转录组映射相结合(借助BiG-MAP等软件,该软件可直接将任何antiSMASH家族软件的输出作为输入) ,这可能是揭示根系分泌物谱系的进化变化如何导致植物宿主对有益和非有益微生物招募发生转变的关键下一步,例如在驯化过程中。

总之,RhizoSMASH 是一款生物信息学软件包,旨在发现细菌基因组中与根际适应性相关的代谢基因簇。我们利用 rhizoSMASH 的工作版本,对广泛的细菌分类群进行了 rCGC 存在/缺失模式的研究,并发现不同分类等级上均存在功能多样化。此外,我们在若干细菌类群的基因组序列中还观察到 rCGC 存在不均匀的局部分布及复制子偏好性。为将 rhizoSMASH 检测到的 rCGC 与根际适应性建立关联,我们开展了两项案例研究,比较了基于 rCGC 和基于代谢途径的随机森林模型在预测根际适应性方面的准确性。这两组数据集的结果证实,与涉及数量庞大代谢物的代谢测定相比,有限数量的rCGCs的存在/缺失谱所承载的生态位特异性信息量相当。总体而言,这些结果表明,在整个系统发育树中,这些rCGCs在适应根际生态位方面发挥着重要作用。

作者简介

Marnix H. Medema 通讯作者

(通讯作者)

Marnix H. Medema

Marnix H. Medema,教授,博士生导师,荷兰瓦赫宁根大学植物科学院生物信息学组主任(Chair Holder of Bioinformatics Group),兼任荷兰莱顿大学客座教授;2013年获格罗宁根大学(RUG)博士学位,先后于加州大学旧金山分校(UCSF)及德国马克斯普朗克海洋微生物研究所(MPI Bremen)从事研究。主要研究方向为生物信息学工具的开发及基于计算生物学方法解析微生物次级代谢潜能及生态功能,是生物合成基因簇预测软件antiSMASH的核心作者,并在Cell、Science、Nature Microbiology、Nature Reviews Microbiology、Nucleic Acids Research等国际权威期刊以及生物信息学领域顶尖期刊以第一或通讯作者身份发表多篇学术论文。

翻译:荀佳妮,基因组所硕士在读

审核:朱志豪,广东医科大学,基因组所联合博士后

终审:刘永鑫,中国农科院基因组所,研究员/博导

排版:申子昂,华南理工大学,基因组所联培硕士在读

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/31 18:07:30

012、小目标标注总被忽略?SAHI 切片策略与超大图标注的工程化方案

012、小目标标注总被忽略&#xff1f;SAHI 切片策略与超大图标注的工程化方案从一次深夜调试说起 去年做遥感图像检测项目&#xff0c;客户给了一张 2 万像素 2 万像素的卫星图&#xff0c;里面密密麻麻的车辆、船只&#xff0c;最小的目标只有 88 像素。我直接扔进 YOLOv8 训…

作者头像 李华
网站建设 2026/5/30 18:11:20

警务机器人核心技术解析:从SLAM导航到多模态交互的工程实践

1. 项目概述&#xff1a;从概念到现实的警务机器人最近几年&#xff0c;如果你在一些大型交通枢纽、商业中心或者特定的大型活动现场留意观察&#xff0c;可能会发现一些造型独特、闪烁着警示灯的机器人正在执勤。它们不是科幻电影里的道具&#xff0c;而是已经投入实际应用的警…

作者头像 李华
网站建设 2026/5/30 9:13:44

AI偏见治理实战:从检测到缓解的全链路解决方案

1. 项目概述&#xff1a;当AI开始“偏心眼”&#xff0c;我们该怎么办&#xff1f;最近几年&#xff0c;AI&#xff08;人工智能&#xff09;这个词火得不行&#xff0c;从帮你写邮件的ChatGPT&#xff0c;到给你推荐下一部剧的Netflix算法&#xff0c;再到决定你能不能拿到贷款…

作者头像 李华
网站建设 2026/5/30 22:00:16

CR2032电池驱动自动变色LED:极简电子制作与电路优化实战

1. 项目概述&#xff1a;当自动变色LED遇上CR2032 如果你手头正好有几颗从废旧设备里拆出来的CR2032纽扣电池&#xff0c;又或者想给某个小物件增加一点无需编程的动态光效&#xff0c;那么这个项目可能就是为你准备的。自动变色LED&#xff0c;也叫七彩慢闪LED&#xff0c;是一…

作者头像 李华
网站建设 2026/5/30 12:40:30

基于Arduino与超声波传感器的交互式LED光雕:从状态机到行为编程

1. 项目概述&#xff1a;当一盏灯有了“脾气” 几年前&#xff0c;我在一个艺术展上看到一件作品&#xff1a;一盏灯&#xff0c;静静地亮着。但当有人靠近时&#xff0c;它却像受惊的小动物一样&#xff0c;光线会“躲”到另一边。那个瞬间&#xff0c;我意识到电子装置可以超…

作者头像 李华