NPJ Precis Oncol（IF=8）中国科学院深圳先进技术研究院吴红艳教授等团队：深度可解释放射基因组学解析乳腺MRI肿瘤微环境-平芜编程栈

文献学习

今天分享的文献是由中国科学院深圳先进技术研究院吴红艳教授等团队于2026年5月在肿瘤学顶刊《npj Precision Oncology》（中科院1区top，IF=8）上发表的研究“Deep interpretable radiogenomic workflow deciphers tumor microenvironment from breast MRI and identifies clinician-interpretable biomarkers”即深度可解释放射基因组学工作流程：通过乳腺MRI解析肿瘤微环境并识别临床可解释的生物标志物，该研究提出一个名为DiRG的深度可解释放射基因组学工作流程，结合乳腺MRI和基因表达数据，非侵入性地解析肿瘤微环境。通过自研的iBayesPrism反卷积算法从bulk转录组数据中推断TME细胞组分，结合深度学习模型识别与TME相关的影像标志物，特别是癌症相关成纤维细胞（CAFs）。研究在多中心数据中验证了CAF相关影像特征在TNBC亚型分型中的稳定性和可解释性，并首次揭示了CAF比例与T细胞浸润之间的负相关关系。

关键词：放射基因组学；乳腺MRI；肿瘤微环境 (TME)；癌症相关成纤维细胞 (CAFs)；三阴性乳腺癌 (TNBC)；可解释人工智能；影像生物标志物；肿瘤无创分型

创新点：①提出肿瘤异质性感知的反卷积算法iBayesPrism，通过迭代更新参考矩阵，从bulk转录组数据中精准推断TME细胞组分与表达。②首次揭示TNBC中CAF比例与T细胞浸润呈显著负相关，阐明CAF可能的免疫抑制机制，为靶向联合免疫治疗提供新依据。③构建结合Grad‑CAM与影像组学的可解释框架，实现无监督病变标注，从MRI中识别临床可理解的CAF相关成像标志物。

临床价值：①实现术前无创 TME评估，替代有创活检，避免信息滞后，为早期诊断和个体化治疗提供关键依据。②通过 CAF 影像标志物预测免疫治疗反应，利用 CAF‑T 细胞负相关关系，指导免疫联合方案，提升疗效。③识别六个跨数据中心稳定的影像组学特征（如球形度、熵值），构建高精度XGBoost 模型，实现 TNBC 的无创、鲁棒分型。

图 1：深度可解释放射基因组学框架（DiRG）与数据集总览

A：DiRG完整工作流（5步核心流程）

肿瘤微环境推断（TMI）：iBayesPrism反卷积解析bulk数据，得到8类细胞比例与基因表达

深度放射组学特征提取：UNet提取乳腺MRI多尺度深度特征

放射基因组学建模：融合基因+影像特征，预测TME组分与乳腺癌亚型

MRI生物标志物识别：Grad-CAM定位关键影像区域，得到免疫微环境标志物（I-markers）

无创分型建模：基于可解释放射组学特征，构建TNBC无创分型模型

B：研究数据集详情（5大队列）

单细胞队列：GEO，84样本/337200细胞，用于反卷积算法验证

放射基因组学队列：TCGA，分发现集（88人）、验证集（29人），配对基因+MRI

放射组学队列：ISPY1（81人）、NACT-Pilot（39人），仅MRI数据

临床队列：中山大学肿瘤防治中心（SYSUCC），237人（96例TNBC），真实临床数据

研究背景和目的

研究背景

肿瘤微环境（TME）在癌症的发生、发展、转移及治疗响应中发挥着关键作用，尤其是在乳腺癌等实体瘤中，TME的组成（如免疫细胞、癌症相关成纤维细胞、内皮细胞等）与患者的预后和免疫治疗疗效密切相关。然而，目前TME的评估主要依赖于有创的病理活检或手术切除组织，这不仅增加了患者的风险，也难以实现动态监测，导致信息滞后。此外，肿瘤的高度异质性使得基于少量活检样本的评估难以全面反映整体TME状态，从而限制了可靠生物标志物的发现。放射基因组学旨在通过将医学影像与基因组学数据关联，实现非侵入性地评估TME，但现有方法多依赖固定的基因表达参考矩阵或基因签名，难以适应不同肿瘤亚型间的异质性，且缺乏对TME中细粒度细胞类型（如CAFs、CD4+ T细胞等）的精确推断能力。因此，亟需一种稳健、可解释且能适应肿瘤异质性的放射基因组学工作流，以从常规乳腺MRI中深度解码TME信息，并识别出临床医生可理解的影像生物标志物，从而推动个性化治疗策略的发展。

研究目的

本研究旨在开发一个深度可解释的放射基因组学工作流（DiRG），用于从乳腺MRI图像中非侵入性地解码肿瘤微环境，并识别出临床可解释的影像生物标志物，特别是针对三阴性乳腺癌（TNBC）的亚型分型和免疫治疗响应预测。具体目标包括：构建一个基于iBayesPrism的自适应反卷积算法，结合定制化的单细胞参考矩阵，从批量转录组数据中稳健地推断出包括CAFs、CD4+ T细胞、巨噬细胞、内皮细胞等在内的八种关键TME细胞类型的比例和基因表达；建立一套深度放射基因组学模型，将MRI图像特征与TME组分和癌症亚型进行关联，并通过Grad-CAM等可解释性模块识别出与TME最相关的影像区域，从而提取CAF相关的影像组学特征；开发一个基于XGBoost的非侵入性分型模型，仅使用影像组学特征即可区分TNBC与非TNBC患者，并在多中心数据集中验证其泛化能力；揭示CAF比例与T细胞浸润之间的负相关关系，为理解TNBC中的免疫逃逸机制提供新见解；最终，通过基因重要性分析（SMPL模块）识别与TNBC和CAF相关的关键基因，促进新型标志物的发现和临床应用转化。

数据和方法

研究数据

总样本：479例乳腺癌患者 + 79例肺癌患者

数据来源（5个队列）：

单细胞队列（GEO：Wu et al., GSE136831）

放射基因组学发现队列（TCGA-BRCA，n=88）

放射基因组学验证队列（TCGA-BRCA，n=29）

放射组学队列（ISPY1，n=81；NACT-Pilot，n=39）

临床队列（中山大学肿瘤中心，n=237）

数据类型：DCE-MRI影像、bulk RNA-seq、单细胞RNA-seq、临床病理信息

技术方法

iBayesPrism反卷积：基于BayesPrism和定制化参考矩阵，从bulk数据中推断TME细胞组分。

深度学习模型：U-Net提取影像特征，结合基因特征，预测TME和亚型。

Grad-CAM注意力机制：识别与TME最相关的影像区域。

放射组学特征提取：提取36个可解释特征（一阶、形状、GLCM）。

XGBoost建模：构建非侵入性亚型分型模型。

SMLP基因重要性分析：识别关键驱动基因。

实验结果

反卷积性能：iBayesPrism在Wu数据集上Pearson相似度> 0.9，优于CIBERSORT、xCell等。

TME差异：TNBC组中CAF比例显著低于非TNBC组，CD4+ T细胞、巨噬细胞、内皮细胞比例更高。

新发现：首次揭示CAF比例与T细胞浸润呈负相关。

预测模型性能：

影像-CAF模型准确率：0.87

影像-TNBC模型准确率：1.0

放射组学特征：

TNBC组：SumAverage、Sphericity ↑

TNBC组：MaximumDiameter、Skewness、InterquartileRange、Entropy ↓

多中心验证：平均准确率 > 0.8，特征分布高度一致。

基因重要性：识别出KRT8、CCT6A、ENO1、TUBB等TNBC相关基因。

图 2：去卷积结果与统计分析

图2A显示，iBayesPrism方法在Wu数据集中预测的细胞比例最接近真实分布，优于其他方法。图2B显示其与真实值的Pearson和余弦相似度均超过0.9。图2C表明，在TNBC与非TNBC之间，CD4+ T细胞、CAF、巨噬细胞等五种细胞比例存在显著差异。图2D展示了两组细胞比例的平均分布差异。图2E的PCA分析显示，CAF对非TNBC和TNBC分组的影响最大，突出了其在亚型区分中的关键作用。

图 3：基因集富集分析结果

图3A比较了去卷积前后富集通路的差异，去卷积后新出现间隙连接通路等。图3B显示，去卷积后识别出PSAT1、CCNE1等与TNBC相关的显著差异表达基因。图3C和3D进一步展示了IL-17信号通路、AMPK信号通路、抗原处理与呈递通路等在TNBC中的富集情况。去卷积后的数据在保留原有信息的同时，揭示了新的生物学通路，增强了对肿瘤微环境功能状态的理解。

图 4：放射基因组学模型性能与影像标志物

图4A和4B展示了两位患者的Grad-CAM热图，高CAF组比低CAF组有更大的注意力区域，集中在肿瘤周边。图4C和4D展示了CAF相关影像组学特征在TNBC与非TNBC之间的显著差异，如Minimum、JointEntropy升高，StandardDeviation、Kurtosis降低。图4E显示，Image-CAF模型的准确率达0.87，Image-TNBC模型准确率为1.0，验证了模型在独立队列中的稳健性。

图 5：多中心验证与非侵入性分型结果

图5A–5C展示了在ISPY、NACT-Pilot和临床队列中，CAF-I-marker自动生成的病灶注释与真实标注高度一致。图5D显示了13个在多个模型中重复出现的重要影像组特征，其中MaximumDiameter、Sphericity、Entropy等6个特征在所有数据集中分布一致。图5E显示XGBoost模型在五个数据集中的准确率分别为0.89、0.94、0.73、0.87、0.70，显著优于UNetFC模型，证明CAF引导的影像组特征具有强泛化能力

研究结论

该研究提出的深度可解释影像基因组学工作流程（DiRG），通过整合乳腺MRI与肿瘤微环境（TME）数据，实现了非侵入性的三阴性乳腺癌（TNBC）精准分型，并识别出具有临床可解释性的影像生物标志物。核心结论包括：首先，研究开发的iBayesPrism去卷积算法能准确从bulk转录组数据中推断TME细胞组成，并首次揭示癌症相关成纤维细胞（CAF）比例与T细胞浸润水平呈显著负相关，提示CAF在免疫逃逸中的关键作用。其次，基于影像组学特征构建的模型在多个多中心数据集中平均准确率超过0.8，成功识别出与CAF相关的稳定影像标志物，如Sphericity、Entropy、MaximumDiameter等，这些特征在TNBC与非TNBC组间分布差异显著，且与BI-RADS语义描述具有良好对应关系。最后，通过基因重要性分析，模型不仅验证了KRT8、CCT6A等多个已知TNBC相关基因，还发现了CRABP2、S100A11等潜在新标志物，增强了模型的生物学可解释性。总体而言，该工作为无需手术活检的肿瘤微环境评估与乳腺癌亚型预测提供了高效、可泛化的计算框架，具有重要的临床转化潜力。

Q&A

Q1：该研究试图解决肿瘤诊疗中的哪一个关键难题？

A1：研究旨在解决肿瘤微环境无法术前、无创、动态评估的临床难题。目前TME分析依赖有创活检或手术标本，存在风险、信息滞后且难以重复。本研究通过乳腺MRI与基因数据的深度整合，实现了非侵入性解析TME，并识别出可被临床医生理解的影像生物标志物，从而为早期诊断、免疫治疗反应预测和个性化治疗提供无创工具。

Q2：该研究提出的DiRG工作流程中，最核心的技术创新是什么？

A2：最核心的技术创新有三项：①iBayesPrism反卷积算法：基于BayesPrism与迭代更新的定制化参考矩阵，能够从bulk转录组数据中稳健推断TME中8种关键细胞类型（包括CAF、CD4+ T细胞等），克服了传统方法因肿瘤异质性导致的偏差。②可解释的放射基因组学模型：结合U-Net影像特征提取、Grad-CAM注意力机制与SMLP基因重要性分析，实现了影像-基因-表型的深度关联，并首次从乳腺MRI中识别出与CAF相关的稳定影像标志物。③无监督病灶标注方法：利用CAF标志物自动标注MRI中的关键区域，无需人工勾画，提升了临床可推广性。

参考文献：Peng Q, Xu Y, Shen L, Bao X, Zhou S, Ye X, Gu Y, Gong J. Habitat-based CT radiomics profiling spatial-temporal heterogeneity in resectable NSCLC predict pathological response to neoadjuvant chemoimmunotherapy: a multi-center study. NPJ Precis Oncol. 2026 Mar 31. doi: 10.1038/s41698-026-01388-z.

NPJ Precis Oncol（IF=8）中国科学院深圳先进技术研究院吴红艳教授等团队：深度可解释放射基因组学解析乳腺MRI肿瘤微环境

NotebookLM相似推荐失效？3个被90%用户忽略的语义嵌入陷阱及实时修复指南

岩体结构数字化识别与力学参数变异性表征工程应用【附数据】

TPS61088RHLR升压芯片：从数据手册到实战PCB设计的完整指南

用Matlab玩转涡旋光：手把手教你绘制拉盖尔-高斯光束的光强与相位图

从递归到滚动数组：爬楼梯问题的四种解法演进与实战剖析

告别硬件SPI！用Arduino模拟SPI搞定LD3320语音识别的完整指南