news 2026/4/30 13:21:56

如何利用NMF算法定义肿瘤“元程序”?这篇高分文章把多组学(bulk+单细胞+空间转录组)联合分析玩透了

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何利用NMF算法定义肿瘤“元程序”?这篇高分文章把多组学(bulk+单细胞+空间转录组)联合分析玩透了

结肠癌长在左边还是右边,对患者的治疗方案和预后结果有着决定性影响。临床观测发现,右半结肠癌(RCC)患者的生存率普遍低于左半结肠癌(LCC),且两者对靶向治疗的敏感度截然不同,这种由解剖部位导致的“侧性”差异究竟受何种分子机制驱动?

2024年6月18日,《Cell Reports Medicine》杂志在线发表了南京医科大学汪美林教授、张正东教授及杜睦龙教授团队的研究成果,揭示了左右半结肠癌中截然不同的多细胞免疫抑制中心。今天我们就来拆解一下这篇文章:Distinctive multicellular immunosuppressive hubs confer different intervention strategies for left- and right-sided colon cancers。

研究概述

本研究针对结肠癌的异质性,通过对105名患者的426,863个单细胞进行转录组分析,并结合空间转录组及大规模组织病理学验证,定义了恶性上皮细胞中具有侧性偏向的两种表达元程序。研究发现,LCC富集增殖干性(PS)元程序,通过糖代谢重编程形成酸性微环境;而RCC富集免疫分泌(IS)元程序,主要分布在缺氧区域,通过招募特定髓系及T细胞亚群实现免疫逃逸。

实验设计

研究团队采用了平行探索的发现队列与验证队列设计。实验流程包括:1. 收集新鲜结肠癌及癌旁组织进行单细胞转录组测序(scRNA-seq);2. 利用CopyKat算法区分恶性与非恶性上皮;3. 采用非负矩阵分解(NMF)鉴定肿瘤内元程序;4. 结合空间转录组(ST-seq)定位多细胞交互网络;5. 利用多重免疫荧光(mIHC)和免疫组化(IHC)在独立的大规模临床队列中验证关键细胞亚群及分子;6. 通过ICI治疗队列评估元程序与免疫检查点抑制剂疗效的关系。

研究结果

图1:构建了结肠癌单细胞图谱,证实RCC中髓系细胞和T细胞比例高于LCC,而B细胞比例较低。


图2:在恶性上皮中鉴定了PS和IS两个具有侧性偏向的元程序,PS在LCC中活跃,IS在RCC中活跃。


图3:证实PS程序与有氧糖酵解及LCC预后不良相关,IS程序与缺氧信号及RCC预后不良相关。


图4:髓系细胞分析显示SPP1+巨噬细胞在RCC中特异性富集,并与肿瘤分期及不良预后正相关。


图5:T细胞分析发现RCC中富集处于静息记忆状态、细胞毒性较弱的CD8-CD161 T细胞。


图6:空间转录组揭示了PS上皮与Mph-PLTP细胞、激活的Tregs构成生态位,而IS上皮与Mph-SPP1及CD8-CD161细胞在缺氧区共定位。


图7:在免疫治疗队列中,响应患者的IS上皮比例在治疗后下降,且ICI可能促进了CD8-CD161向功能性T细胞的转化。

数据分析

生信分析

本研究涉及的组学技术包括单细胞转录组测序(scRNA-seq)、空间转录组测序(ST-seq)以及大批量转录组测序(Bulk RNA-seq)。

分析流程
  1. 1.scRNA-seq分析:使用Seurat包进行批次效应处理和标准化,利用FindVariableFeatures识别高变基因。通过PCA降维及FindClusters完成细胞聚类,SingleR进行细胞类型初筛。CopyKat算法基于基因表达推断染色体拷贝数变异(CNVs),以此鉴定恶性上皮细胞。NMF包用于提取肿瘤内表达程序,通过Jaccard分析确定跨样本的表达元程序。利用AUCell计算单个细胞的元程序评分。Monocle2构建CD8+ T细胞的拟时序发育轨迹,CellChat推断不同细胞间的配体-受体交互强度。

  2. 2.ST-seq分析:采用Seurat处理空间点位矩阵,通过LogVMR标准化数据。利用FindTransferAnchors和TransferData将单细胞测序的细胞类型定义映射至空间坐标。AddModuleScore用于计算空间点位的特征基因评分,以SpatialFeaturePlot展示元程序及细胞亚群的空间共定位情况。

  3. 3.Bulk数据分析:整合TCGA-COAD和GEO(GSE39582)数据,使用ssGSEA对元程序特征基因集进行打分。基于打分结果,利用maxstat进行最优切分,评估元程序与患者5年总生存期(OS)的相关性。

  4. 4.组学联合分析:通过锚定分析将单细胞水平的细胞通讯预测与空间转录组的物理距离信息相结合,验证了LCC中糖酵解驱动的多细胞枢纽和RCC中缺氧驱动的免疫抑制网络。

统计分析

组间差异比较根据数据分布采用Mann-Whitney-Wilcoxon检验或Student’s t检验。存活率评估使用Kaplan-Meier方法及Log-rank检验。临床特征及CMS亚型分布比例的比较采用卡方检验(Chi-squared test)。

总结

研究意义

研究阐明了左右半结肠癌在细胞构成和交互网络上的本质差异,提出了侧性特异性的治疗方案:LCC可能受益于CTLA-4阻断联用糖酵解抑制剂,而RCC则更适合PD-1/PD-L1抑制剂联用氧气自产声动力疗法或抗EGFR治疗。

文章复现

这篇文章的原始数据和生信分析代码都公开了,非常全面。

原始数据存放在中国国家基因库(CNGBdb):

  • • 项目编号:CNP0005614

  • • 地址:https://db.cngb.org/cnsa/

生信分析代码托管地址:

  • • https://github.com/ChengBioinfo/DiffSided_CRC_SCseq

  • • https://doi.org/10.5281/zenodo.11001103


推荐阅读

中国银河生信云平台(UseGalaxy.cn)致力于零代码生信分析。平台拥有海量计算资源、3000 多个生信工具和数十条生信流程,并且为用户提供 200G 免费存储空间。进群交流请先加 usegalaxy 为好友。

最佳Galaxy生信云平台教程:从入门到精通(图文版)

转录组分析流程和工具大全(最强总结)

全网最佳WGCNA分析教程,一键完成

一文搞懂GSEA富集分析

一文详解细菌耐药性生信分析:从下机数据到耐药基因鉴定

一文学会从测序数据到构建系统发育树:超全面的详细步骤与软件指南

推荐课程

我们还为进阶用户提供高质量培训课程,欢迎参加:

RNA-seq数据分析实战 | 2026年第2期,开启你的生信学习之旅

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/29 10:45:57

StructBERT中文-large模型精彩案例:智能客服问答对匹配真实效果

StructBERT中文-large模型精彩案例:智能客服问答对匹配真实效果 1. 模型能力概览 StructBERT中文文本相似度模型是基于structbert-large-chinese预训练模型,使用多个高质量数据集训练而成的专业级文本匹配工具。该模型在智能客服、问答匹配、语义搜索等…

作者头像 李华
网站建设 2026/4/30 12:04:26

人脸识别OOD模型的边缘计算部署

人脸识别OOD模型的边缘计算部署 1. 为什么需要在边缘设备上部署OOD人脸识别模型 在实际业务场景中,我们经常遇到这样的问题:摄像头拍到的人脸质量参差不齐——有的模糊、有的过曝、有的戴着口罩、有的角度奇怪,甚至有些根本不是人脸。传统的…

作者头像 李华
网站建设 2026/4/25 1:07:44

PasteMD在出版行业的应用:图书排版自动化

PasteMD在出版行业的应用:图书排版自动化 1. 出版社的排版困局:从作者交稿到成书的漫长等待 出版社编辑老张最近又加班到凌晨两点。他面前摊着三份不同格式的稿件:一份是作者用Markdown写的初稿,一份是从微信对话里复制过来的访…

作者头像 李华
网站建设 2026/4/18 12:06:44

REX-UniNLU智能体开发:Skills集成指南

REX-UniNLU智能体开发:Skills集成指南 1. 引言:当智能体学会“十八般武艺” 想象一下,你正在开发一个智能客服机器人。用户问:“帮我查一下昨天从北京飞往上海的航班,顺便看看那边的天气怎么样,再推荐一家…

作者头像 李华
网站建设 2026/4/27 11:34:37

从零到一:TPU-MLIR模型转换实战中的避坑指南与性能优化

从零到一:TPU-MLIR模型转换实战中的避坑指南与性能优化 在边缘计算和AI加速领域,模型转换工具链的质量直接决定了算法落地的效率。TPU-MLIR作为算能科技推出的新一代编译器工具链,正在重塑开发者对模型部署的认知边界。本文将带您深入BM1684平…

作者头像 李华