GitHub 6k Star，挖出49个CVE：这个国产AI代码审计工具杀疯了！-平芜编程栈

来自：

推荐一个程序员编程资料站：

http://cxyroad.com

副业赚钱专栏：https://xbt100.top

2024年IDEA最新激活方法

后台回复：激活码

CSDN免登录复制代码插件下载：

CSDN复制插件

以下是正文。

我是小路。

最近看到一个挺有意思的 AI 安全审计项目。

说实话，现在 AI Coding 工具已经很多了，但真正往代码安全审计方向做的，其实还不算多。

这个项目叫 DeepAudit Github。

目前在 GitHub 已经有 6k+ Star，作者给它的定位挺直接：

国内首个开源代码漏洞挖掘多智能体系统。

我第一反应其实是：

这东西如果真跑通了，价值会非常大。

因为代码安全审计，本来就是很多公司最烧钱的一部分。

尤其是：

金融；
SaaS；
政企；
互联网平台。

很多时候一次专业安全审计，报价都不便宜。

所以我这两天也专门研究了一下 DeepAudit 到底是怎么做的。

这篇文章，就拆开聊聊它的架构、思路，以及它目前真实存在的问题。

01 | DeepAudit 本质上不是 AI 问答，而是 AI 协作系统

很多人现在一提 AI Agent，其实本质上还是：

套一层 Claude；
包一层 GPT；
做几个 Prompt；
最后就敢叫 Agent。

但 DeepAudit 不太一样。

它是真的把任务拆成了多个独立角色。

整个系统里，目前有四个核心 Agent。

分别负责不同事情。

第一个是：

Orchestrator。

相当于总调度。

你把项目丢进去之后，它会先分析整个仓库结构：

用了什么技术栈；
有哪些目录；
哪些模块重要；
任务怎么拆。

然后再把不同工作派给后面的 Agent。

最后也是它负责：

汇总漏洞；
过滤误报；
生成最终报告。

第二个是：

Recon Agent。

这个有点像侦察兵。

它负责扫描项目结构、分析依赖、识别 API 入口。

本质上是在建立攻击面地图。

这一点其实挺关键。

因为传统 SAST 工具有个老问题：

只会扫规则。

它不理解：

框架约定；
路由结构；
业务入口。

但 Agent 可以从语义层面理解代码。

第三个是：

Analysis Agent。

这个才是真正负责漏洞分析的。

它后面接了 RAG 知识库。

里面包含：

CWE；
CVE；
漏洞规则；
历史案例。

分析代码时，它会做语义匹配，而不是单纯关键词扫描。

这一点和传统规则引擎区别很大。

以前很多安全工具本质上是：

if else 扫描器。

现在开始有点像：

AI 安全研究员。

第四个也是最关键的：

Verification Agent。

这也是 DeepAudit 和很多 AI 审计工具最大的区别。

它不是发现漏洞就结束。

而是：

自动生成 PoC。

然后把 PoC 丢进 Docker 沙箱执行。

只有真正跑通的漏洞，才会被写进最终报告。

这一点特别重要。

因为传统 SAST 最大的问题就是误报。

扫 100 条漏洞：

真正能利用的，可能不到一半。

但 DeepAudit 相当于：

自己帮你做了一轮漏洞验证。

这个思路其实挺聪明。

02 | 它真正厉害的地方，是把 AI 拉进了完整安全流程

很多 AI 工具现在的问题是：

只能做分析。

但安全审计真正耗时间的，其实不是看代码。

而是：

验证；
复现；
确认；
写报告。

DeepAudit 其实是在尝试把整个链路串起来。

从：

代码理解；
攻击面分析；
漏洞推理；
PoC 生成；
漏洞验证；
最终报告。

全部自动化。

这已经不是传统意义上的代码助手了。

更像一个自动化安全研究流程。

尤其是 Verification 这一层。

这个设计我觉得是整个项目最有价值的地方。

因为它开始尝试解决：

AI 安全工具最致命的问题。

误报。

以前很多 AI 审计产品的问题是：

看起来很聪明。

但最后报出来一堆：

疑似风险；
可能漏洞；
潜在问题。

安全团队还得自己重新验证。

等于工作量根本没减少。

但 DeepAudit 的逻辑是：

不能利用的漏洞，不进报告。

这件事的意义其实非常大。

03 | 整个架构其实很标准，但思路挺现代

DeepAudit 的技术栈其实不复杂。

后端：

Python + FastAPI。

Agent 编排：

LangGraph。

向量库：

ChromaDB。

数据库：

PostgreSQL。

缓存：

Redis。

前端：

React + TypeScript。

UI 用的是：

shadcn/ui。

整个项目结构挺清晰。

backend/agents/ 目录下面，就是几个核心 Agent：

orchestrator.py；
recon.py；
analysis.py；
verification.py。

而且它有一个点我挺认可：

沙箱是独立容器。

PoC 验证不会直接在宿主机执行。

因为安全工具如果直接在本机跑漏洞验证，其实风险很大。

尤其是：

RCE；
命令注入；
反序列化。

这些东西如果隔离不好，工具本身就可能变成风险源。

所以 Docker 沙箱隔离这个设计是对的。

04 | 它已经真实挖出来不少漏洞了

目前 DeepAudit 团队已经拿它跑了不少国内开源项目。

而且最关键的是：

很多漏洞已经被官方确认。

甚至进入了 CVE。

比如：

禅道 PMS；
Dataease；
O2OA；
Jimureport；
Litemall；
Mall；
xxl-job；
eladmin。

这些项目里，它都挖出来过真实漏洞。

包括：

SSRF；
JNDI 注入；
反序列化；
XSS；
硬编码凭据；
命令注入。

很多 CVSS 分数都在 9.8。

已经属于高危级别。

还有 OpenClaw 那边的多个 GHSA 漏洞，也都是官方确认过的。

这一点其实很重要。

因为 AI 安全工具最怕的就是：

看起来很厉害，但没有真实成果。

而 DeepAudit 至少已经证明：

它确实能挖出东西。

这也是目前它最有说服力的地方。

05 | 但它的问题，其实也非常明显

不过研究完之后，我也发现它现在的问题其实不少。

首先是：

太依赖模型能力。

DeepAudit 的 Agent 是典型 ReAct 工作流。

也就是：

Thought；
Action；
Action Input。

这种模式特别依赖模型稳定输出固定格式。

如果模型不够强，很容易跑偏。

比如：

GPT-4o；
Claude；
DeepSeek V3。

问题还不算大。

但如果你换成本地小模型：

Qwen2.5-7B；
小参数 Llama。

很多时候跑几步之后：

格式漂移；
Agent 卡死；
上下文错乱。

整个链路直接断掉。

所以现在其实存在一个问题：

支持 Ollama，不等于本地模型真能跑好。

第二个问题是：

成本很高。

因为它不是单 Agent。

而是四个 Agent 轮流工作。

每一步都在消耗 Token。

如果你扫的是大型项目：

几十万行代码；
复杂微服务；
长上下文仓库。

API 成本会非常夸张。

尤其 Claude 这种模型。

可能一次完整审计就能跑掉不少钱。

而传统 SAST：

几秒钟就扫完了。

所以它现在更像：

高精度模式。

不是快速模式。

06 | PoC 验证也不是万能的

很多人看到自动 PoC 验证，会觉得：

这是不是已经能替代安全专家了？

其实还差得远。

因为很多真实漏洞，根本不是单机环境能复现的。

比如：

复杂微服务联动；
多组件依赖；
内网环境；
特殊认证链路；
内存破坏类漏洞。

这些东西，Docker 沙箱根本搭不出来。

还有一些漏洞：

理论上存在；
但自动生成的 PoC 根本打不通。

所以现在的 PoC 验证，更适合：

SQL 注入；
命令注入；
XSS；
SSRF。

这种偏通用型漏洞。

复杂漏洞目前还是很依赖人工。

07 | AI 安全审计这个方向，其实很值得关注

虽然 DeepAudit 现在还不算特别成熟。

Issues 里其实也有不少问题：

项目加载失败；
路径识别错误；
报告定位偏差；
沙箱镜像拉取失败。

这些都是典型开源早期项目会遇到的问题。

但我觉得它真正有价值的地方，不是现在完成度有多高。

而是：

它证明了一件事。

AI 开始真正进入代码安全领域了。

而且不是简单问答。

而是在尝试接管完整安全流程。

这件事其实很重要。

因为未来安全行业很可能会越来越像：

AI 初筛；
AI 验证；
人工复核。

尤其是中小团队。

以前很多公司根本没有能力做专业安全审计。

但 AI 可能会把这个门槛快速拉低。

当然，它现在肯定还替代不了专业安全研究员。

但作为：

辅助工具；
项目摸底；
漏洞初筛。

已经开始有实用价值了。

后面就看作者团队能不能继续把稳定性、误报率、上下文能力继续往上做。

如果真能把 Agent 漏洞审计这条路跑通，未来可能会是 AI Coding 之外，非常重要的一条赛道。

<END>

推荐阅读：

副业赚钱推荐：让你的时间开始变现！

免费体验AI图片生成，就在 Image Generator Hub！

程序员在线工具站：cxytools.com 推荐一个自己写的工具站：https://cxytools.com，专为程序员设计，包括时间日期、 JSON处理、SQL格式化、随机字符串生成、UUID生成、文本Hash...等功能，提升开发效 率。 ⬇戳阅读原文直达！ 朕已阅

GitHub 6k Star，挖出49个CVE：这个国产AI代码审计工具杀疯了！

书匠策AI拆解报告：一个工具是怎么把毕业论文“流水线化“的？看完你就懂了

Armv8-A架构浮点舍入指令FRINTM与FRINTN详解

如何5分钟快速部署ChanlunX缠论插件：通达信自动化技术分析终极指南

UE5 DeveloperSettings配置实战：C++热重载与多平台参数管理

Java反序列化在JBoss中的真实利用与加固实践

DeepCAD深度解析：基于深度学习的CAD模型生成终极指南