news 2025/12/24 21:28:19

PBJ |兰科植物多组学数据库OrchidMD正式上线,解锁我国传统兰花基因挖掘与分子育种新路径

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
PBJ |兰科植物多组学数据库OrchidMD正式上线,解锁我国传统兰花基因挖掘与分子育种新路径

近日,国际知名期刊《Plant Biotechnology Journal》在线发表了由广东省农业科学院环境园艺研究所牵头联合广东省农业科学院水稻研究所和大理大学完成的“OrchidMD: An Integrated and User-Interactive Orchid Multi-Omics Database for Mining Genes and Biological Research”研究论文。该工作针对兰科植物研究中多组学数据分散、整合分析工具缺乏的核心痛点,构建了首个覆盖基因组、转录组、蛋白质组、代谢组和表型组的兰科植物多组学综合交互数据库 OrchidMD(www.orchidcomics.com)。该数据库整合213个兰科物种的 329.40 Gb多组学数据,开发18种专业化分析工具,通过“数据整合 – 工具创新–工功能验证”的研究思路,不仅实现了兰科植物多维度数据的高效检索与交互式分析,更通过 ARF 基因家族鉴定、CRISPR 基因编辑靶点设计两个典型案例,证实其在兰科基因挖掘与基因编辑的实用价值,为兰科植物基础研究、分子育种与资源保护提供了全新的一站式研究平台。

兰科(Orchidaceae)是被子植物中物种多样性最丰富的家族之一,包含约 3万个物种,广泛分布于全球各地,兼具极高的观赏、药用、文化与生态价值。从热带雨林中的附生兰到干旱沙漠中的地生兰,兰花演化出独特的生物学特性:如依赖真菌的种子萌发机制、与传粉者高度协同的花部结构、适应附生生活的景天酸代谢(CAM)光合途径,以及复杂庞大的基因组。这些特性不仅是植物进化研究的重要模型,也为园艺育种提供了丰富的性状资源。

近年来,多组学技术已成为解析植物关键性状分子机制的核心手段。在水稻、小麦、玉米等主要作物中,多组学整合平台的建立极大推动了功能基因组学研究与育种应用。然而,兰科植物研究中,现有数据库多局限于单一组学数据存储,在多维度数据关联分析尚有不足,尤其难以支撑花型发育、花香合成、逆境响应等复杂性状的遗传解析。此外,兰科植物基因编辑研究中,传统 CRISPR 靶点设计工具因未适配兰花基因组特征,存在效率低、脱靶风险高等问题,制约了其在兰花育种中的应用进程。

为解决上述瓶颈,研究团队系统整合全球兰科植物多组学数据,创新开发分析工具,构建了OrchidMD 数据库。该平台不仅涵盖22个高质量基因组、767 个转录组文库、26 个蛋白质组数据集、51 个代谢组数据集及 227 个种质的表型数据,更通过整合 GWAS 分析、共线性分析、CRISPR 设计等功能模块,实现从 “数据检索–基因筛选–功能预测–实验设计”的全流程支持。研究通过两个典型案例验证了平台的实用性:一是鉴定ARF基因家族并证实CsiARF04促进墨兰龙根分化,二是利用CRISPR引物设计工具,助力实现CsiPDS基因高效编辑,为兰科植物研究提供了可直接应用的技术方案。全文主要研究结果如下:

1 OrchidMD 数据库核心架构:五大组学整合,23 个模块覆盖全研究场景

为实现兰科植物多组学数据的系统整合与高效利用,研究团队构建了 “数据层–工具层–应用层”三层架构的OrchidMD平台,核心数据资源与功能模块如下:

1.1 多维度数据资源:覆盖 213 个物种,总数据量达 329.40 Gb

OrchidMD 整合了来自213个兰科物种的五大组学数据,经标准化处理后形成结构化数据库,具体包括:

基因组数据:收录22个高质量兰科物种基因组,涵盖树兰亚科(17个物种)、拟兰亚科(2个物种)、兰亚科(2个物种)、香荚兰亚科(1个物种),共注释 569,981个基因,其中 432,716个基因提供GO、KEGG等功能注释;同时整合 65,318,522 个单核苷酸多态性(SNP)和 3,906,176 个结构变异(SV),为遗传变异分析提供基础。

转录组数据:汇集174个物种的767个RNA-seq文库。尤其针对其中225个有参考基因组的转录组样本统一计算表达量,输入基因ID即可自动生成高水平论文发表级eFP电子荧光图谱。

蛋白质组数据:整合26个蛋白质组数据集,涉及墨兰、石斛兰、蝴蝶兰等物种,涵盖花发育阶段比较、叶色突变体差异、真菌共生响应、铅/盐胁迫应答等,如墨兰6个花发育阶段的蛋白质动态变化、霍山石斛盐胁迫下的蛋白表达差异,为翻译水平研究提供数据支撑。

代谢组数据:收录51个高分辨率代谢组数据集,覆盖18个兰科物种的器官特异性代谢谱(根、假鳞茎、块茎、叶、花)、昼夜代谢动态(12 h光周期下7个时间点)、环境适应性代谢变化等,共鉴定6114种代谢物,包括花香成分、色素、抗逆相关次生代谢物等。

表型组数据:收集 227个墨兰核心种质的84个表型性状,同时整合156,630

张兰属植物图像,为表型 - 基因型关联分析奠定基础。

图1. OrchidMD总览

1.2 23 个功能模块:从数据浏览到实验设计的全流程支持

OrchidMD 设计 23 个功能明确的模块,覆盖多组学数据分析的核心需求,关键模块功能如下:

数据浏览与检索模块:包括“Genome Browse”(基因组浏览器,支持染色体区间、基因ID检索,可视化基因结构、变异位点)、“Gene Search”(基因搜索,支持基因ID、序列同源性检索,直接下载核酸/蛋白质序列)、“Gene Location”(基因定位,输入基因 ID 生成个性化染色体定位图),满足基础数据获取需求。

比较基因组分析模块:“Collinearity Analysis”(共线性分析)可识别 395,908个蛋白质间的1,484,675 个互作关系及123,038个共线性区块,支持基因家族进化分析;“Gene Orthology Clusters”(基因同源簇)整合 OrthoVenn3 工具,实现不同物种同源基因分组与物种特异性基因筛选。

功能分析模块:“GO/KEGG Enrichment Analysis”(富集分析)支持目标基因集的功能分类与通路注释;“Gene Co-Expression Networks(GCNs)”(基因共表达网络)已鉴定 8,881,927个共表达基因对,输入基因 ID 即可获取功能关联基因;“Transcription Factors”(转录因子)模块收录 35,122个转录因子,涵盖 AP2/ERF、MYB、bHLH 等主要家族,支持调控因子筛选。

育种与实验工具模块:“Primer Designer”(引物设计)支持基因特异性引物设计;“CRISPR Design”针对兰科植物基因组优化,预测高效编辑靶点;“Breed Recognition”(品种识别)基于深度学习模型,上传图像即可快速鉴定兰属物种,准确率达86.50%;“GWAS”(全基因组关联分析)模块支持遗传变异与表型性状关联分析,辅助关键基因定位。

1.3 技术架构与用户体验:高稳定性、高兼容性、零门槛使用

OrchidMD 基于ThinkPHP 5.0.24 框架与jQuery 3.6.0 前端开发,采用 Apache 2.4.53 web 服务器与 MySQL 8.0.29 数据库引擎,通过 Apache JMeter 性能测试验证:平台支持多用户并发访问,median响应时间<1秒,稳定性优异;同时采用 HTTPS 加密与角色访问控制,保障数据安全。

平台兼容 Chrome、Opera、Firefox、Edge、Safari 等主流浏览器,无需注册即可免费使用,所有分析结果支持可视化导出,且提供详细的使用教程,即使无生物信息学专业背景的研究者也能快速上手。

图2.OrchidMD部分代表性功能模块

2 OrchidMD 在基因挖掘与基因编辑中的应用

2.1 ARF 基因家族鉴定与 CsiARF04 功能验证

生长素响应因子(ARF)是植物生长素信号通路的核心转录因子,通过结合靶基因启动子的AuxRE元件调控生长发育,但兰科植物中 ARF 基因家族的系统鉴定与功能研究尚未报道。研究团队利用OrchidMD 的“Transcription Factors” 与“Gene Family”模块,完成从基因筛选到功能验证的全流程研究:首先,通过“Gene Family”模块设定保守结构域(PF06507)检索条件,从16个兰科物种基因组中鉴定出281个ARF转录因子,基于系统发育分析将其分为4个亚家族;结合“Gene Expression”模块的时空表达数据发现,墨兰(Cymbidium sinense)中的CsiARF04在花芽和根中高表达,且与花发育、根分化相关基因共表达,利用“Gene Expression”模块的电子荧光图谱(eFP)系统分析CsiARF04表达模式,发现其在花芽和根中表达量最高。为验证功能,研究团队构建 35S::CsiARF04过表达载体,通过农杆菌介导转化墨兰龙根,结果显示转基因植株首次出芽时间(7.02±0.82 天)较Ruby对照(17.36±1.28 天)提前 10.34 天(59.56%)、较 EV对照(16.78±1.72 天)提前 9.76 天(58.16%),差异极显著(p<0.001);转化后 30 天,转基因植株出芽中位数(4.00,IQR 3.00-5.00)显著高于 Ruby 对照(3.00,IQR 2.00-3.00)和 EV 对照(3.00,IQR 2.00-4.00)。该案例证实,OrchidMD可高效完成基因家族筛选、表达模式分析,为功能基因验证提供精准靶点,显著缩短研究周期。

2.2 CRISPR设计工具助力实现墨兰CsiPDS基因高效编辑

八氢番茄红素脱氢酶(PDS)是类胡萝卜素合成的关键基因,其突变会导致植物白化表型,常作为基因编辑效率验证的报告基因。研究团队利用OrchidMD 的 “CRISPR Design”模块,针对墨兰CsiPDS基因设计靶点并验证编辑效率,解决传统工具在兰花中编辑效率低的问题:通过 “CRISPR Design” 模块输入CsiPDS基因ID(Mol008762),平台基于兰花基因组GC含量、脱靶风险评分,预测出两个最优靶点。基于该靶点序列,研究团队构建 pCAMBIA3301-Cas9-sgRNA 载体,通过农杆菌介导转化墨兰幼叶,培养4天后提取基因组DNA;通过 PCR 扩增CsiPDS靶点区域,将产物克隆至测序载体后随机挑选20个单克隆测序,结果显示靶点1编辑效率达 35%,靶点2编辑效率达20%。测序结果证实,OrchidMD 设计的靶点编辑效率显著高于传统工具(平均编辑效率约15%),且脱靶检测未发现非特异性突变,说明该工具适配兰科植物基因组特征,可用于高效基因编辑实验设计。

图3. OrchidMD应用案例

OrchidMD数据库的成功构建,不仅从多组学分析角度揭示兰花独特生物学特性的分子机制和进化规律,同时还能推动分子育种进程,包括性状基因定位、基因编辑设计和后代鉴定等关键环节,为兰科植物基础研究到产业应用提供了全链条支撑。未来OrchidMD平台将持续迭代更新,并增加数据共享与协作功能,深化基础研究与产业应用的紧密衔接。

3 研究团队与项目资助

该工作由广东省农业科学院环境园艺研究所魏永路、林增裕、谢琦为论文共同第一作者,杨凤玺、朱根发、刘琦、杨邓奇为共同通讯作者。大理大学李文康、黄传峰等参与平台开发与数据处理。该工作得到国家重点研发计划、广东省科技计划项目、广东省农业科学院项目等多个项目的资助。

论文链接:

https://doi.org/10.1111/pbi.70445

数据库链接:

http://www.orchidcomics.com

最全1000+植物核基因组数据库IMP (点击图片直达)

高颜值免费 SCI 在线绘图(点击图片直达)


往期精品(点击图片直达文字对应教程)

LinuxPython

R绘图NGS基础GEO高级

生信自学生信书籍系列教程心得体会

转录组经典宏基因组蛋白质组单细胞系列测序发展史

免费在线画图色彩搭配图形排版图形解读

ChIP-seqTCGAGSEAWGCNA

海哥组学傻瓜系列文章写作

CytoscapeExcelPPT

机器学习

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/19 17:25:01

B+Tree索引引擎:构建亿级数据存储的极速解决方案

BTree索引引擎&#xff1a;构建亿级数据存储的极速解决方案 【免费下载链接】bplustree A minimal but extreme fast B tree indexing structure demo for billions of key-value storage 项目地址: https://gitcode.com/gh_mirrors/bp/bplustree 在当今数据爆炸的时代&…

作者头像 李华
网站建设 2025/12/19 17:24:43

5步搭建Nginx性能监控系统:VTS Exporter实战指南

Nginx VTS Exporter是一款专为Prometheus生态设计的Nginx监控数据采集工具&#xff0c;能够将Nginx Virtual Host Traffic Status模块生成的统计信息转换为标准Prometheus指标格式。无论您是运维工程师还是开发人员&#xff0c;掌握这款工具都能让您对Nginx服务器的运行状态了如…

作者头像 李华
网站建设 2025/12/19 17:24:26

DataCap免费开源数据集成平台完整部署与使用指南

DataCap免费开源数据集成平台完整部署与使用指南 【免费下载链接】datacap DataCap 是数据转换、集成和可视化的集成软件。支持多种数据源&#xff0c;文件类型&#xff0c;大数据相关数据库&#xff0c;关系型数据库&#xff0c;NoSQL 数据库等。通过软件可以实现管理多种数据…

作者头像 李华
网站建设 2025/12/19 17:24:21

NVIDIA开源GPU内核模块深度解析:5大内存管理策略提升性能300%

还在为GPU内存管理头痛不已&#xff1f;想要让应用性能飙升却不知从何下手&#xff1f;NVIDIA开源GPU内核模块的内存管理机制正是你需要的性能优化工具。通过本文&#xff0c;你将掌握从基础分配到高级优化的完整知识体系&#xff0c;彻底告别内存瓶颈。 【免费下载链接】open-…

作者头像 李华
网站建设 2025/12/19 17:23:53

Open-AutoGLM升级失败频发?深度剖析兼容性断点及修复路径

第一章&#xff1a;Open-AutoGLM系统版本不兼容适配在部署 Open-AutoGLM 系统过程中&#xff0c;开发者常遇到因依赖库或核心组件版本不匹配导致的运行时异常。此类问题多出现在模型加载、推理服务启动或API调用阶段&#xff0c;典型表现为模块未找到错误&#xff08;ModuleNot…

作者头像 李华
网站建设 2025/12/19 17:23:52

DETR模型评估指标深度解析:从原理到实战应用

DETR模型评估指标深度解析&#xff1a;从原理到实战应用 【免费下载链接】detr End-to-End Object Detection with Transformers 项目地址: https://gitcode.com/gh_mirrors/de/detr DETR&#xff08;End-to-End Object Detection with Transformers&#xff09;作为基于…

作者头像 李华