DataCon24漏洞赛道冠军分享：vuln_wp——大模型赋能的漏洞自动化分析全解析

发布于2025-03-27|1067|1

该资源是来自武汉大学0817IOTG团队，DataCon2024漏洞分析赛道冠军的开源和解题分享，其开源提供了漏洞情报提取与漏洞挖掘两大核心模块的解决框架，并打包成一个可执行 Docker 镜像压缩包，方便安全研究者和开发者快速部署体验自动化漏洞分析。极其适合开发者、研究者、学生学习和应用。快来 Github 点个 Star ，Fork 并 Watch，试试吧！希望对大家有所帮助。

其开源地址如下：

https://github.com/123f321/datacon24_vuln_wp

文章目录：

什么是 DataCon24_vuln_wp？
项目背景与设计初衷
核心模块与技术亮点

1. 情报提取模块
2. 漏洞挖掘模块

项目优势
如何参与与贡献
结语

什么是 DataCon24_vuln_wp？

DataCon24_vuln_wp 是基于 DataCon 2024 漏洞分析赛道冠军战队 0817iotg 的完整解题方案，开源提供了漏洞情报提取与漏洞挖掘两大核心模块的解决框架，并打包成一个可执行 Docker 镜像压缩包，方便安全研究者和开发者快速部署体验自动化漏洞分析。

项目地址如下，包含详细源码分析，记得点赞喔！

https://github.com/123f321/datacon24_vuln_wp

项目背景与设计初衷

安全需求驱动
冠军战队方案基础

核心模块与技术亮点

1. 情报提取模块

任务目标：快速从大量漏洞分析文章中提取关键摘要信息，涵盖文件名、漏洞编号、厂商/产品名称、编程语言、漏洞成因、危险函数、以及 POC/EXP 相关信息等多维度数据。
技术框架：

技术实现：

利用 BeautifulSoup4 对 HTML 进行解析，精准过滤图片等无关内容。
采用精细化的提示工程方法，将信息拆分成多个输出维度，使用两次大模型调用分别判定，确保提取结果准确且具备多角度分析。
内置投票机制，对多轮大模型输出进行校验，自动剔除不合理或低置信度结果。
扩展功能：除基础信息外，还能识别版本信息、修复建议，并从文章中提取 POC/EXP 代码和图像内容。（详见 task1_source_code 中的 test.py、appendix.py 及 pic_expand.py）

2. 漏洞挖掘模块

任务目标：针对传统静态审计费时费力的问题，自动化识别代码中的潜在漏洞，实现精准定位。
技术框架：

技术实现：

先对待分析文件进行大小排序、类型过滤，再依据编程语言进行函数级别的切分，确保每个代码片段都能单独分析。
利用提示工程进行初步筛查，提取可能包含漏洞的种子函数；对种子函数内容进行深度解析，针对不同漏洞类型（如 race condition、SQL 注入、double-fetch、buff_overflow、command_injection 等）采用不同分析策略。
部分复杂漏洞类型引入 RAG 技术，结合多轮提示与结果投票，有效降低误报，并输出最有可能的漏洞函数供后续手工验证或自动修复。

项目优势

大模型助力
多轮校验机制
开箱即用
全 Python 实现
丰富的实践案例

如何参与与贡献

获取项目
开源互动
实践分享

结语

DataCon24_vuln_wp 为网络安全领域提供了一种自动化漏洞分析思路，利用大模型与精细提示工程，实现了从情报提取到漏洞定位的全流程智能化处理。无论你是安全研究新手还是资深专家，这个项目都将提供一定帮助，助力构建更安全的数字世界。立即加入我们，共同探索自动化漏洞分析的无限可能！

最后，分享不易，赶快前往 GitHub，尤其从事大模型漏洞挖掘和参与DataCon的同学，体验这一前沿的漏洞分析自动化解决方案吧！

https://github.com/123f321/datacon24_vuln_wp

InForSec2025网络空间安全学术年会暨DataCon2024颁奖仪式在京召开

数据科学竞赛（DataCon）驱动的网络安全实践课程教学模式探索