Eur Radiol（IF=4.7）哈尔滨医科大学肿瘤医院等团队：基于大语言模型和Gd-EOB-DTPA增强MRI的术后肝细胞癌风险分层系统-平芜编程栈

文献学习

今天分享的文献是由哈尔滨医科大学肿瘤医院等团队于2026年2月在《European Radiology》（中科院2区，IF=4.7）上发表的研究“Large language model and Gd-EOB-DTPA-enhanced MRI-based risk stratification system for postoperative hepatocellular carcinoma: a multicenter study”即基于大语言模型和Gd-EOB-DTPA增强MRI的术后肝细胞癌风险分层系统：一项多中心研究，该研究开发并验证了一种全自动风险分层系统（FASS），该系统整合了临床血清生物标志物、自动化影像组学特征以及由大语言模型（LLM）提取的语义特征，用于预测孤立性肝细胞癌（HCC）患者术后预后。研究结果表明，FASS具有良好的预测性能（C-index在测试集和外部验证集中分别为0.78和0.76），并能有效区分高风险与低风险患者。转录组分析进一步揭示了高风险组中炎症和细胞因子信号通路的激活。

创新点：①首次将多模态大语言模型与影像组学深度融合，实现术后肝癌风险全自动分析与语义特征提取。②构建全自动分割+特征提取+LLM语义分析一体化系统，突破传统影像组学依赖人工标注的瓶颈。③结合转录组学验证高风险组分子机制，揭示炎症与细胞因子通路激活，实现影像-基因关联解释。

临床价值：①实现术后肝癌风险个体化分层，辅助临床制定精准治疗与随访策略。②全流程自动化、可重复、可解释，提升影像组学的临床转化潜力。③早期识别高风险患者，有望改善术后生存预后，指导精准干预决策。

图 1：研究整体工作流

数据收集与去标识：纳入HMUCH、HNCH、SDCH三个中心的HCC患者，对DICOM格式的MRI影像、血清临床数据进行去标识和配准，同时划分训练队列（n=211）、测试队列（n=128）、RNA-seq队列（n=59）、外部验证队列（n=50）。

自动分割模型构建：以训练队列的人工手动分割肿瘤区域为金标准，训练3D深度学习自动分割模型，最终优化得到MedNeXt-loss框架。

多维度特征提取：

临床血清特征：提取AFP、AST等14项血清生物标志物；

Chat语义特征：通过ChatGPT-4o提取MRI影像的6项放射学语义特征，以混淆矩阵验证其与人工标注的一致性；

自动影像组学特征：通过PyRadiomics库从自动分割区域提取107项影像组学特征，经筛选得到核心预后特征。

FASS构建与验证：整合上述三类特征构建FASS，通过K-M生存曲线（Kaplan-Meier）、C指数验证系统效能，同时对患者进行风险聚类分析。

生物学可解释性探索：结合RNA-seq队列的转录组数据，解析FASS风险分层的分子生物学机制。

研究背景和目的

研究背景

肝细胞癌（HCC）是全球第三大癌症相关死亡原因，严重威胁公共健康，其中手术切除是孤立性HCC患者的首选根治性治疗手段。然而，尽管这类患者在临床上表现为相对同质的肿瘤负荷与肝功能保留特征，但由于HCC内在的生物学和分子异质性，其术后预后差异依然显著。目前，术前精准评估预后并进行风险分层，对于优化手术决策和个体化随访策略具有关键临床意义。钆塞酸二钠增强MRI已成为HCC无创诊断和特征描述的核心工具，结合影像组学可提取定量特征以反映肿瘤异质性和微环境复杂性。然而，传统影像组学分析高度依赖人工肿瘤分割和特征标准化，不仅耗时费力，且在不同观察者和机构间存在可重复性差的问题。近年来，深度学习在自动化分割领域取得进展，但仍难以实现影像特征的语义理解，而大语言模型的出现为自动整合视觉与文本信息、模拟专家级影像解读提供了新的技术路径。因此，构建一个集成临床血清标志物、自动化影像组学特征与LLM语义特征的全自动、可解释的预后分层系统，成为克服现有瓶颈、推动精准医学在肝癌外科领域应用的重要研究方向。

研究目的

本研究旨在开发并验证一种全自动风险分层系统，用于接受肝切除术的孤立性肝细胞癌患者的术后预后预测。该系统创新性地整合了三类互补的信息维度：临床血清生物标志物、基于深度学习自动分割的影像组学特征，以及由多模态大语言模型提取的语义影像特征。研究首先通过改进的MedNeXt-loss框架实现肿瘤的自动、精准分割，并从Gd-EOB-DTPA增强MRI中提取高通量影像组学特征。在LLM选择上，系统比较了五种主流模型在特征提取准确性与完整性的表现，最终选定性能最佳的ChatGPT-4o作为语义特征提取工具，并采用循环提示策略提升其输出稳定性与连续性。随后，通过单因素与多因素Cox回归筛选血清与语义特征中的独立预后因子，结合影像组学特征构建综合预测模型。研究进一步通过转录组测序与通路富集分析，探索FASS高风险组与低风险组间的生物学差异，揭示其潜在的分子机制。最终目标是建立一个全自动、可解释、具有生物学依据且具备跨中心泛化能力的个体化预后评估工具，为肝胆外科的精准决策提供技术支持。

数据和方法

研究数据

总样本量：448例孤立性HCC患者（来自三个中心）

训练集：211例

测试集：128例

外部验证集：50例

RNA-seq队列：59例（用于生物学机制探索）

数据来源：Gd-EOB-DTPA增强MRI影像、临床血清指标、术后随访数据

图 2：患者入组与排除流程图

技术方法

自动分割：基于改进的MedNeXt-loss模型进行肿瘤自动分割。

影像组学特征提取：使用PyRadiomics提取107个特征，并通过Random Survival Forest筛选出4个关键特征。

LLM语义特征提取：比较5种LLM（ChatGPT-4o、ChatGPT-5、Grok、Claude 4、Gemini 2.5），最终选用ChatGPT-4o进行循环提示策略提取六项影像语义特征。

模型构建：基于Cox回归和RSF构建血清、影像组学和LLM语义特征模型，最终整合为FASS。

性能评估：使用C-index、time-ROC、DCA等方法评估模型性能。

生物学分析：对FASS高风险组与低风险组进行RNA-seq差异表达、GO/KEGG通路富集和PPI网络分析。

实验结果

分割性能：MedNeXt-loss模型的Dice系数达0.77。

LLM选择：ChatGPT-4o在准确性和输出完整性上表现最佳（准确率81.9%）。

独立预后因素：AFP、AST和“不规则肿瘤边界”是OS的独立预测因子。

FASS性能：C-index在测试集为0.78，外部验证集为0.76；能有效分层OS和RFS（log-rank p < 0.05）。

生物学机制：高风险组中CXCL8、IL1B等炎症相关基因上调，富集于IL-17信号通路、细胞因子互作等通路。

图 3：ChatGPT-4o评估语义影像特征的性能

图 4：FASS模型性能验证

图 5：FASS分层的Kaplan-Meier（K-M）生存曲线

图 6：FASS分层的生物学功能分析

研究结论

该研究成功构建并验证了一种全自动风险分层系统（FASS），用于接受肝切除术的孤立性肝细胞癌（HCC）患者的术前预后预测。该系统创新性地整合了三个互补层次的信息：临床血清生物标志物、基于深度学习的自动影像组学特征，以及由多模态大语言模型（ChatGPT-4o）自动提取的语义影像特征。研究表明，通过循环提示策略优化的ChatGPT-4o能够以超过80%的准确率稳定识别关键的影像学特征，其中“不规则肿瘤边缘”被证实为独立预后因素。最终构建的FASS模型在测试集（C指数0.78）和外部验证集（C指数0.76）中均表现出优越且稳定的预测性能，并能有效区分高风险与低风险患者（p<0.05）。更重要的是，通过转录组学分析发现，FASS定义的高风险组肿瘤富集了炎症反应和细胞因子信号通路（如CXCL8、IL1B等），为模型的预后判断提供了生物学层面的解释。综上，FASS提供了一个全自动化、可解释且具有生物学依据的个体化风险评估工具，有望精准指导肝胆肿瘤外科的临床决策。

参考文献：Yu C, Zhang Q, Ding JX, Li W, Han S, Cong S, Wang X, Zhou Y. Large language model and Gd-EOB-DTPA-enhanced MRI-based risk stratification system for postoperative hepatocellular carcinoma: a multicenter study. Eur Radiol. 2026 Feb 23. doi: 10.1007/s00330-026-12424-8.

Eur Radiol（IF=4.7）哈尔滨医科大学肿瘤医院等团队：基于大语言模型和Gd-EOB-DTPA增强MRI的术后肝细胞癌风险分层系统

高性能网络设计秘笈：深入剖析Linux网络IO与epoll

树莓派SPI OLED屏驱动指南：从硬件连接到Python编程实战

企业内网应用安全调用大模型Taotoken访问控制与审计日志实践

观察Taotoken在多模型间路由切换的响应速度与成功率

自托管代码仓库聚合分析平台CodeStacker：架构设计与部署指南

Linux watch 命令深度解析：从实时监控到变化检测的完整实现