news 2026/2/14 7:52:10

Deepseek+RD-Agent 自动化模型生成及进化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Deepseek+RD-Agent 自动化模型生成及进化

Deepseek+RD-Agent 自动化模型生成及进化

原创 QuantML编辑团队 QuantML2025年5月28日 20:26上海

RD-Agent 是一个专注于数据驱动场景的自动化研发系统,旨在简化模型和数据处理的开发流程。该系统通过结合传统软件工程与大语言模型,持续探索、实现和评估解决方案,实现科学方法的自动化。

RD-Agent在量化领域具有显著优势,主要体现在自动化因子发现、模型演化和研究报告处理三个核心方面。

自动化因子演化

RD-Agent 提供了完全自动化的因子发现和演化系统。该系统能够:

  • 持续假设生成:基于历史实验分析和领域专业知识自动提出新的因子假设

  • 迭代优化:通过反馈循环不断改进因子表现

  • 量化验证:使用 Qlib 进行严格的回测验证

自动化模型演化

在模型开发方面,RD-Agent 实现了端到端的自动化流程:

  • 模型架构自动设计:基于假设自动生成和优化模型结构

  • 代码自动实现:将模型设计转换为可执行的 PyTorch 代码

  • 性能自动评估:在CSI300 数据集上进行标准化回测

研究报告自动处理

RD-Agent 独特的报告处理能力为量化研究提供了重要优势:

  • 因子自动提取:从金融研究报告中自动识别和提取潜在交易因子

  • 快速实现验证:将报告中的因子描述转换为可测试的代码

  • 因子库扩展:持续丰富和完善因子库

技术架构优势

CoSTEER 代码生成框架

RD-Agent 使用专门的 CoSTEER 框架进行代码生成,确保高质量的实现:

系统根据任务类型自动选择相应的编码器,包括特征编码器、模型编码器等专门组件。

知识管理和学习

框架具备强大的知识管理能力:

  • 查询相似成功案例

  • 学习历史失败经验

  • 避免重复错误

在之前的文章我们介绍过RD-Agent及其安装方法,官方默认采用OpenAI 的API来实现各类任务。最近花了两天将其改为DeepSeek的API接口,实现自动化模型的生成。

R&D-Agent-Quant

RD-Agent Windows安装教程

RD-Agent : 自动化Quant工厂

首先,RD-Agent团队除了提供OpenAI以及Azure的backend之外,还提供了litellm的backend,通过litellm,能够轻松将接口改为DeepSeek等其他大模型。

具体配置方法为,在环境配置文件.env中,将BACKEND改为litellm,提供模型名称以及API Key:

BACKEND=rdagent.oai.backend.LiteLLMAPIBackend. CHAT_MODEL=deepseek/deepseek-chat DEEPSEEK_API_KEY=sk-***

当我天真的以为这就能够使用DeepSeek之后,才发现这是噩梦的开始,接下来在安装以及使用过程中,我遇到了Ubuntu源,Docker源的网络问题,embedding模型适配,json_model支持,json格式,模型输出效果等一系列问题,所幸大部分问题都得以解决。

不得不说,RD-Agent想法是非常好的,通过集成QLIB框架,利用LLM实现模型和因子的快速猜想和验证。

但是现阶段的问题在于,LLM能力接近一个初级研究员的水平,构造的模型和因子会存在许多问题。

对于模型而言,实际交易中,中低频不太需要去构造复杂深度学习模型,通过RD-Agent构造的模型结果还好。

但是在因子生成任务上,采用代码因子生成模式存在诸多弊端,首先大模型生成的因子代码均为简单因子,加之底层日频的数据类型限制因子种类,以及qlib本身截面算子的限制,很难带来增量alpha信息。

优化方式之一可以改为表达式因子生成的方式,具体可以参考我们之前的文章:

QuantML-Qlib Factor | DeepSeek自动因子挖掘及优化方案

在工程上,代码中频繁使用了try-cache以及retry的方式来确保LLM结果正确,但是这又带来了运行效率较低,在debug时会耗费大量的等待时间。

安装完成后,运行命令:

rdagent fin_model

DeepSeek根据模板自动生成深度学习模型和config配置文件,模型会在qlib的docker中自动运行,结合模型运行的及及结果反馈,DeepSeek尝试优化模型,自动改进模型结果,流程图如下图所示。

生成的模型代码:

模型回测结果:

任务启动之后,接下来就是漫长的等待,模型自动总结已有信息不断迭代生成新的模型结构,期待DeepSeek帮你实现一个效果更好的模型吧!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/12 2:30:55

ZIP压缩包体积过大?三个方法帮你轻松解决!

Zip压缩包是我们生活工作中常见的文件格式了,各种格式的文件都可以压缩为zip压缩包,以便于传输或存储。然而,有时即便压缩文件,还是存在ZIP压缩包体积过大,给我们的操作带来不便。比如邮件传输限制、传输速度过慢、占用…

作者头像 李华
网站建设 2026/2/13 2:49:30

基于ASP.NET的大文件上传控件是否支持跨平台断点续传?

一个卑微.NET程序员的大文件上传历险记 大家好,我就是那个被要求用100块预算搞定20G文件上传、兼容IE8还要7x24小时免费支持的倒霉蛋。让我们一起来看看这个"合理"需求要怎么实现吧! 需求清单的快乐解读 20G大文件上传:因为我们…

作者头像 李华
网站建设 2026/2/13 3:03:23

萤石开放平台 音视频 | 取流协议说明

目前萤石开放平台主要提供以下几种取流协议:EZOPEN协议(萤石监控私有流)、HLS协议(标准流)、RTMP协议(标准流),每种协议有各自的优点和缺点。 下面以功能、性能、跨平台、扩展性进行…

作者头像 李华
网站建设 2026/2/12 1:18:28

2025LLM核心架构进展复盘:Attn与MOE研究精选(收藏版)

本文回顾了2025年大模型(LLM)在注意力机制(Attn)和专家混合(MOE)方面的核心架构进展。重点介绍了TPA、MoBA、NSA等创新方法,如低秩压缩KVcache、Top-k block注意力、原生稀疏注意力等&#xff0…

作者头像 李华
网站建设 2026/2/13 15:56:13

导师推荐!AI论文写作软件 千笔·专业论文写作工具 VS speedai 本科生专属

随着人工智能技术的迅猛迭代与普及,AI辅助写作工具已逐步渗透到高校学术写作场景中,成为本科生、研究生完成毕业论文不可或缺的辅助手段。越来越多面临毕业论文压力的学生,开始依赖各类AI工具简化写作流程、提升创作效率。但与此同时&#xf…

作者头像 李华