news 2026/5/26 12:37:14

GitHub 6k Star,挖出49个CVE:这个国产AI代码审计工具杀疯了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GitHub 6k Star,挖出49个CVE:这个国产AI代码审计工具杀疯了!


来自:

推荐一个程序员编程资料站:

http://cxyroad.com

副业赚钱专栏:https://xbt100.top

2024年IDEA最新激活方法

后台回复:激活码

CSDN免登录复制代码插件下载:

CSDN复制插件

以下是正文。


我是小路。

最近看到一个挺有意思的 AI 安全审计项目。

说实话,现在 AI Coding 工具已经很多了,但真正往代码安全审计方向做的,其实还不算多。

这个项目叫 DeepAudit Github。

目前在 GitHub 已经有 6k+ Star,作者给它的定位挺直接:

国内首个开源代码漏洞挖掘多智能体系统。

我第一反应其实是:

这东西如果真跑通了,价值会非常大。

因为代码安全审计,本来就是很多公司最烧钱的一部分。

尤其是:

金融;
SaaS;
政企;
互联网平台。

很多时候一次专业安全审计,报价都不便宜。

所以我这两天也专门研究了一下 DeepAudit 到底是怎么做的。

这篇文章,就拆开聊聊它的架构、思路,以及它目前真实存在的问题。

01 | DeepAudit 本质上不是 AI 问答,而是 AI 协作系统

很多人现在一提 AI Agent,其实本质上还是:

套一层 Claude;
包一层 GPT;
做几个 Prompt;
最后就敢叫 Agent。

但 DeepAudit 不太一样。

它是真的把任务拆成了多个独立角色。

整个系统里,目前有四个核心 Agent。

分别负责不同事情。

第一个是:

Orchestrator。

相当于总调度。

你把项目丢进去之后,它会先分析整个仓库结构:

用了什么技术栈;
有哪些目录;
哪些模块重要;
任务怎么拆。

然后再把不同工作派给后面的 Agent。

最后也是它负责:

汇总漏洞;
过滤误报;
生成最终报告。

第二个是:

Recon Agent。

这个有点像侦察兵。

它负责扫描项目结构、分析依赖、识别 API 入口。

本质上是在建立攻击面地图。

这一点其实挺关键。

因为传统 SAST 工具有个老问题:

只会扫规则。

它不理解:

框架约定;
路由结构;
业务入口。

但 Agent 可以从语义层面理解代码。

第三个是:

Analysis Agent。

这个才是真正负责漏洞分析的。

它后面接了 RAG 知识库。

里面包含:

CWE;
CVE;
漏洞规则;
历史案例。

分析代码时,它会做语义匹配,而不是单纯关键词扫描。

这一点和传统规则引擎区别很大。

以前很多安全工具本质上是:

if else 扫描器。

现在开始有点像:

AI 安全研究员。

第四个也是最关键的:

Verification Agent。

这也是 DeepAudit 和很多 AI 审计工具最大的区别。

它不是发现漏洞就结束。

而是:

自动生成 PoC。

然后把 PoC 丢进 Docker 沙箱执行。

只有真正跑通的漏洞,才会被写进最终报告。

这一点特别重要。

因为传统 SAST 最大的问题就是误报。

扫 100 条漏洞:

真正能利用的,可能不到一半。

但 DeepAudit 相当于:

自己帮你做了一轮漏洞验证。

这个思路其实挺聪明。

02 | 它真正厉害的地方,是把 AI 拉进了完整安全流程

很多 AI 工具现在的问题是:

只能做分析。

但安全审计真正耗时间的,其实不是看代码。

而是:

验证;
复现;
确认;
写报告。

DeepAudit 其实是在尝试把整个链路串起来。

从:

代码理解;
攻击面分析;
漏洞推理;
PoC 生成;
漏洞验证;
最终报告。

全部自动化。

这已经不是传统意义上的代码助手了。

更像一个自动化安全研究流程。

尤其是 Verification 这一层。

这个设计我觉得是整个项目最有价值的地方。

因为它开始尝试解决:

AI 安全工具最致命的问题。

误报。

以前很多 AI 审计产品的问题是:

看起来很聪明。

但最后报出来一堆:

疑似风险;
可能漏洞;
潜在问题。

安全团队还得自己重新验证。

等于工作量根本没减少。

但 DeepAudit 的逻辑是:

不能利用的漏洞,不进报告。

这件事的意义其实非常大。

03 | 整个架构其实很标准,但思路挺现代

DeepAudit 的技术栈其实不复杂。

后端:

Python + FastAPI。

Agent 编排:

LangGraph。

向量库:

ChromaDB。

数据库:

PostgreSQL。

缓存:

Redis。

前端:

React + TypeScript。

UI 用的是:

shadcn/ui。

整个项目结构挺清晰。

backend/agents/ 目录下面,就是几个核心 Agent:

orchestrator.py;
recon.py;
analysis.py;
verification.py。

而且它有一个点我挺认可:

沙箱是独立容器。

PoC 验证不会直接在宿主机执行。

因为安全工具如果直接在本机跑漏洞验证,其实风险很大。

尤其是:

RCE;
命令注入;
反序列化。

这些东西如果隔离不好,工具本身就可能变成风险源。

所以 Docker 沙箱隔离这个设计是对的。

04 | 它已经真实挖出来不少漏洞了

目前 DeepAudit 团队已经拿它跑了不少国内开源项目。

而且最关键的是:

很多漏洞已经被官方确认。

甚至进入了 CVE。

比如:

禅道 PMS;
Dataease;
O2OA;
Jimureport;
Litemall;
Mall;
xxl-job;
eladmin。

这些项目里,它都挖出来过真实漏洞。

包括:

SSRF;
JNDI 注入;
反序列化;
XSS;
硬编码凭据;
命令注入。

很多 CVSS 分数都在 9.8。

已经属于高危级别。

还有 OpenClaw 那边的多个 GHSA 漏洞,也都是官方确认过的。

这一点其实很重要。

因为 AI 安全工具最怕的就是:

看起来很厉害,但没有真实成果。

而 DeepAudit 至少已经证明:

它确实能挖出东西。

这也是目前它最有说服力的地方。

05 | 但它的问题,其实也非常明显

不过研究完之后,我也发现它现在的问题其实不少。

首先是:

太依赖模型能力。

DeepAudit 的 Agent 是典型 ReAct 工作流。

也就是:

Thought;
Action;
Action Input。

这种模式特别依赖模型稳定输出固定格式。

如果模型不够强,很容易跑偏。

比如:

GPT-4o;
Claude;
DeepSeek V3。

问题还不算大。

但如果你换成本地小模型:

Qwen2.5-7B;
小参数 Llama。

很多时候跑几步之后:

格式漂移;
Agent 卡死;
上下文错乱。

整个链路直接断掉。

所以现在其实存在一个问题:

支持 Ollama,不等于本地模型真能跑好。

第二个问题是:

成本很高。

因为它不是单 Agent。

而是四个 Agent 轮流工作。

每一步都在消耗 Token。

如果你扫的是大型项目:

几十万行代码;
复杂微服务;
长上下文仓库。

API 成本会非常夸张。

尤其 Claude 这种模型。

可能一次完整审计就能跑掉不少钱。

而传统 SAST:

几秒钟就扫完了。

所以它现在更像:

高精度模式。

不是快速模式。

06 | PoC 验证也不是万能的

很多人看到自动 PoC 验证,会觉得:

这是不是已经能替代安全专家了?

其实还差得远。

因为很多真实漏洞,根本不是单机环境能复现的。

比如:

复杂微服务联动;
多组件依赖;
内网环境;
特殊认证链路;
内存破坏类漏洞。

这些东西,Docker 沙箱根本搭不出来。

还有一些漏洞:

理论上存在;
但自动生成的 PoC 根本打不通。

所以现在的 PoC 验证,更适合:

SQL 注入;
命令注入;
XSS;
SSRF。

这种偏通用型漏洞。

复杂漏洞目前还是很依赖人工。

07 | AI 安全审计这个方向,其实很值得关注

虽然 DeepAudit 现在还不算特别成熟。

Issues 里其实也有不少问题:

项目加载失败;
路径识别错误;
报告定位偏差;
沙箱镜像拉取失败。

这些都是典型开源早期项目会遇到的问题。

但我觉得它真正有价值的地方,不是现在完成度有多高。

而是:

它证明了一件事。

AI 开始真正进入代码安全领域了。

而且不是简单问答。

而是在尝试接管完整安全流程。

这件事其实很重要。

因为未来安全行业很可能会越来越像:

AI 初筛;
AI 验证;
人工复核。

尤其是中小团队。

以前很多公司根本没有能力做专业安全审计。

但 AI 可能会把这个门槛快速拉低。

当然,它现在肯定还替代不了专业安全研究员。

但作为:

辅助工具;
项目摸底;
漏洞初筛。

已经开始有实用价值了。

后面就看作者团队能不能继续把稳定性、误报率、上下文能力继续往上做。

如果真能把 Agent 漏洞审计这条路跑通,未来可能会是 AI Coding 之外,非常重要的一条赛道。

<END>

推荐阅读:

副业赚钱推荐:让你的时间开始变现!

免费体验AI图片生成,就在 Image Generator Hub!

程序员在线工具站:cxytools.com 推荐一个自己写的工具站:https://cxytools.com,专为程序员设计,包括时间日期、 JSON处理、SQL格式化、随机字符串生成、UUID生成、文本Hash...等功能,提升开发效 率。 ⬇戳阅读原文直达! 朕已阅
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 12:30:11

Armv8-A架构浮点舍入指令FRINTM与FRINTN详解

1. A64浮点舍入指令概述 在Armv8-A架构的A64指令集中&#xff0c;Advanced SIMD和浮点指令为高性能计算提供了强大的支持。作为其中的重要组成部分&#xff0c;浮点舍入指令在数值计算、信号处理和机器学习等领域发挥着关键作用。FRINTM和FRINTN是两种典型的浮点舍入指令&#…

作者头像 李华
网站建设 2026/5/26 12:30:03

如何5分钟快速部署ChanlunX缠论插件:通达信自动化技术分析终极指南

如何5分钟快速部署ChanlunX缠论插件&#xff1a;通达信自动化技术分析终极指南 【免费下载链接】ChanlunX 缠中说禅炒股缠论可视化插件 项目地址: https://gitcode.com/gh_mirrors/ch/ChanlunX 你是否还在为手工绘制缠论笔段而烦恼&#xff1f;每天花费数小时分析K线图&…

作者头像 李华
网站建设 2026/5/26 12:30:01

UE5 DeveloperSettings配置实战:C++热重载与多平台参数管理

1. 为什么UE5项目里总有人把配置写死在C里&#xff0c;而老手却只动DeveloperSettings&#xff1f; “这个参数改一下&#xff0c;重新编译打包&#xff0c;等十分钟。”——这是我去年在一家中型游戏公司做技术顾问时&#xff0c;听一位刚转UE的Unity程序员说的第一句话。他当…

作者头像 李华
网站建设 2026/5/26 12:28:05

Java反序列化在JBoss中的真实利用与加固实践

1. 这不是“学个漏洞”&#xff0c;而是理解Java反序列化链如何在真实中间件中落地生根 CVE-2017-12149这个编号&#xff0c;对很多刚接触渗透测试的朋友来说&#xff0c;可能只是一串需要背下来的CVE编号&#xff0c;或者某次CTF里被考到的考点。但在我实际参与的二十多个金融…

作者头像 李华
网站建设 2026/5/26 12:27:15

DeepCAD深度解析:基于深度学习的CAD模型生成终极指南

DeepCAD深度解析&#xff1a;基于深度学习的CAD模型生成终极指南 【免费下载链接】DeepCAD code for our ICCV 2021 paper "DeepCAD: A Deep Generative Network for Computer-Aided Design Models" 项目地址: https://gitcode.com/gh_mirrors/de/DeepCAD 在传…

作者头像 李华