news 2026/5/16 12:48:55

OpenAI 和 Paradigm 推出 EVMbench:AI 帮智能合约把关的新工具

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
OpenAI 和 Paradigm 推出 EVMbench:AI 帮智能合约把关的新工具

区块链里锁着上千亿美元的资产,一次次黑客事件让大家看清了安全有多重要。就在最近,OpenAI 联合加密公司 Paradigm 发布了 EVMbench 这个基准测试,专门用来检查 AI 在智能合约安全上的真实水平。它收集了 40 份真实代码审计里的 120 个漏洞,很多来自 Tempo 区块链项目。

Ethereum 官网:https://ethereum.org/

EVMbench 把测试分成三个部分,简单直接。AI 先要找出代码里所有高严重程度的 bug,不能漏掉任何一个。接着,它得修改代码堵住漏洞,同时保证原来的功能还能正常跑,通过自动化测试来验证。最后一步最刺激:在本地模拟的以太坊环境里,AI 要试着把合约里的钱全抽走。

这些测试只挑那些真正能导致资金丢失的高影响漏洞,大部分来自公开的审计比赛。整个过程都在安全可重复的环境里完成,不会影响真实链上资产。

实际跑分出来,利用这个环节 AI 表现最亮眼。OpenAI 的 GPT-5.3-Codex 在利用任务上成功率达到 72.2%,比之前的 GPT-5 提升了一大截。Anthropic 的 Claude Opus 4.6 也拿到了 61.1%。相比之下,检测平均只有 40% 左右,很多时候 AI 扫不全漏洞。修复更难,GPT-5.3-Codex 只有 41.5%,因为既要堵漏洞又不能改坏原有逻辑。

给点提示后成绩会明显上升,比如 GPT-5.2 在中等提示下修复率能到 93.9%。这说明当前 AI 还离不开人的引导,但攻击能力已经很强了。

Paradigm 主要负责挑选漏洞和把关质量,Tempo 则提供了自己高吞吐支付链的审计数据。双方合作让这个基准更贴近真实场景。OpenAI 还在发布时强调,要把 AI 用在防御上。他们拿出了 1000 万美元的 API 积分做网络安全资助,还会继续扩展自己的 Aardvark 代码扫描代理。

EVMbench 现在已经开源,谁都可以基于它继续研究。很多人讨论说,AI 在攻击上进步快,但在全面检测上还有明显短板。这对开发者是个提醒,也给行业提供了跟踪 AI 安全能力的标准工具。

当然它也有局限,只算已知漏洞,而且只针对特定类型的利用方式。不过作为第一个专门针对 EVM 智能合约的 AI 安全基准,它已经把标杆立起来了。未来区块链安全会越来越依赖这类测试,开发者也能更放心地把代码交给 AI 检查。

整体看,EVMbench 把 AI 在高价值基础设施上的双刃剑特性摆在了明面上。攻守之间,差距还很明显,但至少现在有了量化的方式去衡量进步。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/16 12:48:22

微信小程序Python在线课程学习答题系统

文章目录微信小程序Python在线课程学习答题系统技术文章大纲系统架构设计前端开发技术栈后端技术实现核心功能模块数据交互方案部署与运维性能优化策略安全防护措施扩展功能方向系统设计与实现的思路主要技术与实现手段源码lw获取/同行可拿货,招校园代理 :文章底部获…

作者头像 李华
网站建设 2026/5/16 12:48:51

微信小程序Python学科竞赛比赛报名管理系统

文章目录微信小程序与Python后端结合的学科竞赛报名管理系统技术大纲系统架构设计小程序前端关键技术Python后端核心模块数据库设计要点安全与性能优化管理后台功能部署方案扩展性设计系统设计与实现的思路主要技术与实现手段源码lw获取/同行可拿货,招校园代理 :文章…

作者头像 李华
网站建设 2026/4/19 1:24:26

缺陷仿真计算识别:相干光传输计算与深度信息恢复

用于描述缺陷仿真计算识别 属于相干光传输计算或者深度信息恢复光学传输系统里最怕遇到啥?相位畸变、传感器噪声、光学元件损伤这些破事,随便哪个都能让传输质量崩成渣。仿真缺陷的时候,咱们得先搞明白——到底要模拟的是物理层面的损伤&…

作者头像 李华
网站建设 2026/4/24 7:20:50

大数据架构数据流水线:从采集到分析的完整设计

大数据架构数据流水线:从采集到分析的完整设计关键词:大数据架构、数据流水线、数据采集、数据处理、数据分析、分布式计算、实时计算摘要:本文深入探讨大数据架构中数据流水线的完整设计过程,从数据采集到最终分析的各个环节。我…

作者头像 李华
网站建设 2026/4/18 22:21:00

探索基于Matlab的虚拟同步电机并网控制仿真之旅

基于matlab的虚拟同步电机并网控制仿真程序论文在电力系统领域,虚拟同步电机(VSM)技术愈发受到关注,它能让电力电子装置模拟传统同步发电机的运行特性,为电网稳定性和电能质量提升带来新的契机。今天咱就唠唠基于Matla…

作者头像 李华
网站建设 2026/4/18 23:54:12

大数据存算分离架构选型:5大主流方案对比

大数据存算分离架构选型:5大主流方案对比关键词:大数据、存算分离架构、主流方案对比、数据存储、数据计算摘要:本文聚焦于大数据存算分离架构,详细介绍了5种主流的存算分离方案。通过对每种方案的原理、优势、劣势等方面进行对比…

作者头像 李华