GTVD：基于全依赖程序图的多层聚合漏洞检测方法-平芜编程栈

“随着软件规模与复杂度不断增长，自动化漏洞发现成为保障软件供应链安全的关键环节。传统方法往往依赖单一表示或浅层特征，难以捕获程序中的长程依赖与复杂语义关系。为此，来自燕山大学的团队提出了 GTVD（Full-Dependency Program Graph + Multi-Level Aggregation），通过更丰富的图表示与多层消息聚合策略，提升函数级漏洞检测的表示能力与识别精度。”

📄论文标题：GTVD: a multi-level aggregation vulnerability detection method based on full-dependency program graph
📅发表时间：Cluster Computing, 2025
🏫作者单位：燕山大学

01 —

方法介绍

GTVD 的核心思想是用一种更完整的图表示结合多层聚合与自适应加权，解决传统 GNN 在长程依赖与信息衰减上的弱点。整体流程包括：FDPG（Full Dependency Program Graph）构建 → 节点向量化 → 多层消息聚合（MLMA）→ 自适应加权聚合（WAG）→ MLP 分类。

图 1. GTVD框架

小结：FDPG 通过集成 AST/CFG/PDG 并加入反向边与自环，增强了图结构的表达能力；MLMA 扩展了节点的感受野；WAG 则通过注意力/加权机制动态调整节点对全局表示的贡献。

02 —

关键机制

FDPG：
用反向边和自环补全依赖，避免信息单向流失。
MLMA：
一次迭代中融合多阶邻域信息，提升对复杂依赖的捕获。
WAG：
引入自适应加权避免简单均匀聚合导致的噪声传播。

机制	实现方式	主要作用
Full Dependency Program Graph (FDPG)	整合 CPG（AST/CFG/PDG），补入反向边与自环	全面编码语法与语义依赖，增强长程关系表达
Multi-Level Message Aggregation (MLMA)	多阶消息传递，按不同邻域阶数聚合节点信息	扩大节点感受野，缓解信息衰减
Adaptive Weighted Aggregation (WAG)	多头注意力 + MLP 动态计算节点权重	根据上下文调整节点贡献，提高图级表示质量
分类器	MLP + Softmax（二分类）	将图表示映射到漏洞/非漏洞标签

03 —

实验结果

作者在三个公开大规模数据集上进行了全面评估：FFmpeg&Qemu、BigVul、Reveal。数据集统计与训练细节见论文；训练采用 8:1:1 划分，超参与收敛行为在文中有详细说明（Epoch 收敛约 90 轮）。

FFmpeg & Qemu：

模型	A	P	R	F1
VulDeePecker	49.91	46.05	32.55	38.14
SySeVR	47.85	46.06	58.81	51.66
Russell	57.60	54.76	40.72	46.71
IVDetect	57.26	52.37	57.55	54.84
BovdGFE	56.46	50.18	50.63	47.27
AMPLE	62.16	55.64	83.99	66.94
GRACE	59.78	53.94	82.13	65.11
GTVD (本文)	61.39	56.27	60.53	52.32

BigVul:

模型	A	P	R	F1
VulDeePecker	81.19	38.44	12.75	19.15
SySeVR	90.10	30.91	14.08	19.34
Russell	86.85	14.86	26.97	19.17
IVDetect	87.14	17.22	34.04	22.87
BovdGFE	88.94	25.38	28.17	30.29
AMPLE	93.14	22.98	34.58	32.11
GRACE	90.73	32.52	39.08	35.50
GTVD (本文)	93.91	38.02	56.88	32.27

Reveal:

模型	A	P	R	F1
VulDeePecker	76.37	21.13	13.10	16.17
SySeVR	68.51	16.21	52.68	24.79
Russell	81.77	31.55	61.14	41.62
BovdGFE	88.72	40.16	43.73	35.42
AMPLE	92.71	51.06	46.15	48.48
GRACE	89.73	33.21	61.53	43.13
GTVD (本文)	90.52	61.76	68.38	48.83

小结：GTVD 在三套数据集上的综合性能优于大多数基线：在 Accuracy 上对比最新基线的提升分别为FFmpeg&Qemu +1.61%,BigVul +3.18%,Reveal +0.79%；此外在 Recall 指标上，GTVD 在 BigVul 与 Reveal 上分别最小提升了17.8%与6.85%.

📌 总结

GTVD 通过三项设计（FDPG、MLMA、WAG）解决了图表示在长程依赖与信息衰减上的痛点，实现了在多数据集上的稳健提升。该方法对函数级漏洞检测尤为适用，并为将来把图表示与 LLM/混合方法结合提供了可行的方向。论文也指出未来工作将扩展到更多语言与跨项目泛化研究。

📣 欢迎留言讨论

你更看好“更丰富的图表示 + 更强的 GNN”路线，还是“把图结构信息以检索/提示的方式喂给 LLM”路线？
在企业级审计中，FDPG 这类复杂表示的工程成本是否值得？

📌 点赞 + 收藏 + 分享，你的支持，是我们持续解析高水平软件安全论文的最大动力！

飞腾D2000平台固件编译打包实战：从源码到BIOS的完整流程（V1.0.5版避坑指南）

飞腾D2000平台固件编译打包实战：从源码到BIOS的完整流程（V1.0.5版避坑指南） 在国产处理器生态快速发展的今天，飞腾D2000作为高性能桌面级CPU的代表，其固件开发环境搭建与编译过程却常让开发者陷入"环境配置-编译失…

李华

AI Agent 的 Skills 到底怎么做？从概念、架构到落地，一篇讲透

一、先说结论：Skills 是让 Agent 变专业的“能力包”很多人做 AI Agent，刚开始只会堆 Prompt、接工具、调接口。但真正上线后会发现一个问题：大模型会说话，不代表它会稳定干活。比如你让它生成营销文案，它可能这次写得…

李华

别再只用WebRTC了！用LiveKit Server + Go快速搭建一个低延迟的Web音视频聊天室

别再只用WebRTC了！用LiveKit Server Go快速搭建一个低延迟的Web音视频聊天室音视频通信已经成为现代Web应用的核心功能之一，从在线教育到远程医疗，从社交软件到企业协作，实时音视频技术正在重塑我们的数字交互方式。然而&#x…

李华

AISMM与DCAM/DMM整合实践全图谱（2024权威认证版）：覆盖L1-L5成熟度跃迁的12个关键耦合点

更多请点击： https://intelliparadigm.com 第一章：AISMM与DCAM/DMM整合的理论根基与演进逻辑 AISMM（Artificial Intelligence Systems Maturity Model）并非孤立演进的评估框架，其设计深度植根于数据治理成熟度模型&am…

李华

STM32 HAL库中断里用HAL_Delay卡住了？别慌，教你SysTick优先级怎么调（附CubeMX配置）

STM32 HAL库中断里用HAL_Delay卡住了？别慌，教你SysTick优先级怎么调（附CubeMX配置） 刚接触STM32 HAL库的开发者经常会遇到一个诡异现象：在中断服务函数里调用HAL_Delay()后，整个系统突然卡死，按…

李华

如何5分钟掌握BepInEx：游戏插件框架的终极安装与配置指南

如何5分钟掌握BepInEx：游戏插件框架的终极安装与配置指南【免费下载链接】BepInEx Unity / XNA game patcher and plugin framework 项目地址: https://gitcode.com/GitHub_Trending/be/BepInEx BepInEx是一款强大的游戏插件框架，专为Unity Mono…

李华