摘要
植物能产生具有广泛工业应用价值的天然产物,因此解析这些化合物的生物合成途径极具研究意义。转录组和代谢组数据集可用于构建基因 - 代谢物网络,进而助力生物合成基因的鉴定。单细胞 RNA 测序(scRNA-seq)和单细胞质谱代谢组学(scMS)的最新进展,已能实现对单个细胞中基因表达或代谢物水平的单独检测。然而,这些数据集仅能间接关联单细胞水平的基因表达与代谢物浓度。本概念验证研究以药用植物长春花(Catharanthus roseus)的叶片细胞为研究对象,证实 scRNA-seq 与 scMS 可应用于同个植物细胞,从而实现基因表达与代谢物水平的直接对比。研究通过基于微流控的机器人将原生质体分选至 96 孔板,随后在适用于 scMS 和 SMART-seq 单细胞实验方案的条件下裂解细胞。该联用技术揭示了单个细胞中代谢物水平与生物合成基因表达之间的定性和定量关联,为解析驱动植物复杂生物合成的潜在机制提供了新视角。
意义
植物通过复杂的生物合成途径产生具有重要价值的代谢物,这些代谢过程通常由多个基因共同调控。单细胞组学技术的进步已能实现对单个细胞中基因表达或代谢物水平的检测,本研究则证实这2种技术可应用于同1个单细胞。该方法能够生成匹配的基因 - 代谢物数据集,实现单细胞分辨率下的严谨关联分析。这种整合策略有助于发现参与代谢物合成的基因,进而为获取这些高价值分子提供助力。
结果
图1植物单细胞原生质体的多组学联用
(A)植物原生质体单细胞转录组与代谢组同步分析流程。
(B)单个细胞中检测到的基因数量。
(C)测序读数与基因组的比对率。
(D)单个细胞中检测到的代谢物数量。2组间的统计差异通过双侧柯尔莫哥洛夫 - 斯米尔诺夫(KS)检验计算(***P < 0.01;NS,无统计学意义)。箱线图中,箱体代表4分位距(IQR),须代表 1.5 倍4分位距内的最大值和最小值。
(E)代谢组学图谱总结,实验方法参照先前研究。12 种分析物浓度间的皮尔逊相关系数通过色阶可视化呈现。
图2基于基因表达和代谢物表达的细胞类型 UMAP 聚类分析
(A)RNA-UMAP 图中基于标记基因的细胞类型注释。
(B)代谢组 UMAP(MET-UMAP)图中基于靶向分析物的细胞类型注释。
(C)基于对应孔位标识关联两种不同的 UMAP 图,细胞颜色根据代表性代谢物(蛇根碱、裂环烯醚萜、毛蕊花糖苷、番木鳖酸)的积累情况进行注释。
(D)桑基图展示基于基因标记或代谢物的细胞注释结果的异同。图的高度与细胞数量成正比。左侧为基于标记基因的细胞类型注释,右侧为基于代谢物的细胞类型注释。
图3基因与代谢物的定量关联分析
(A)所有基因的斯皮尔曼相关系数按其与各列出化合物的相关排名绘图。
(B)NMT、D4H 和 DAT 基因的表达水平(TPM,每千碱基转录本每百万映射读数)趋势线(含 95% 置信区间的局部回归)按各列出化合物的浓度递增顺序绘制。
图4 不同细胞类型中转运体基因表达与代谢物存在的关联
(A)已知细胞间转运体 - 代谢物对共存情况的热图。单个细胞中每个基因表达和代谢物积累的 Z 值通过颜色标注并进行层次聚类。
(B)基于相关性的代谢物与推定转运体(导入体 / 导出体)的预期网络。相关系数排名前 15 位和后 15 位的转运体与网络中的代谢物相连。每个转运体的连接数通过色阶表示。已有研究报道或提及的转运体已标注说明。
Scheme1长春花代谢物的合成途径
本研究靶向的关键代谢物以红色文字突出显示。蓝色文字标注本研究测得的平均细胞内浓度。黑色文字标注选定的生物合成基因。虚线表示这些步骤的生物合成基因尚未确认。毛蕊花糖苷(Mauritianin)与其他靶向代谢物的生物合成无关,在插图框中单独展示。
详细结果
思维导图(mindmap 脑图)
实验模型与材料
关键分析技术
参考
Proc Natl Acad Sci U S A. 2025 Oct 28;122(43):e2512828122. doi: 10.1073/pnas.2512828122.Epub 2025 Oct 24. Single-cell metabolome and RNA-seq multiplexing on single plant cells
注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。