AI + 渗透测试开源项目调研报告
·
调研时间: 2026 年 3 月
调研范围: 开源渗透测试与 AI 融合项目
数据来源: GitHub、技术社区、安全媒体
📊 核心项目总览
| 项目名称 | GitHub 仓库 | 核心定位 | 成熟度 | 推荐指数 |
|---|---|---|---|---|
| Shannon | KeygraphHQ/shannon | 全自主 AI 渗透测试框架 | ⭐⭐⭐⭐⭐ | 🔥 强烈推荐 |
| PentestGPT | GreyDGL/PentestGPT | LLM 赋能渗透测试工具 | ⭐⭐⭐⭐⭐ | 🔥 强烈推荐 |
| Strix | usestrix/strix | 自主 AI 黑客代理 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ 推荐 |
| PentAGI | vxcontrol/pentagi | 多智能体渗透测试系统 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ 推荐 |
| OWASP ZAP + AI | zaproxy/zaproxy | AI 增强漏洞扫描 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ 推荐 |
🔍 项目深度分析
1️⃣ Shannon(KeygraphHQ/shannon)
项目地址: https://github.com/KeygraphHQ/shannon
核心特性
- 全自主 AI 渗透测试框架,无需人工干预
- 两阶段测试架构:静态代码分析 + 动态应用测试
- 多智能体协作:不同 AI 代理负责不同测试阶段
- 可交付利用代码:不仅报告漏洞,还生成实际利用脚本
- XBOW 基准测试 96.15% 成功率,排名第一
技术架构
Shannon 工作流程:
┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ 阶段 1: SAST │ → │ 阶段 2: DAST │ → │ 利用生成 │
│ 静态代码分析 │ │ 动态应用测试 │ │ PoC 脚本 │
└─────────────┘ └─────────────┘ └─────────────┘
↓ ↓ ↓
代码漏洞映射 运行时漏洞验证 可执行利用代码
集成能力
- ✅ Nmap 网络扫描集成
- ✅ Claude API 驱动核心推理
- ✅ Docker 容器化部署
- ✅ 持续审计工作流
- ✅ 每工作流统一日志系统
深度评价
| 维度 | 评分 | 说明 |
|---|---|---|
| 自动化程度 | ⭐⭐⭐⭐⭐ | 真正的全自主,无需人工干预 |
| 漏洞发现率 | ⭐⭐⭐⭐⭐ | XBOW 基准 96.15% 成功率 |
| 误报率 | ⭐⭐⭐⭐ | 多阶段验证降低误报 |
| 易用性 | ⭐⭐⭐⭐ | Docker 一键部署,CLI 友好 |
| 社区活跃度 | ⭐⭐⭐⭐⭐ | 2026 年 2 月 GitHub 热榜第 1 |
| 文档完善度 | ⭐⭐⭐⭐ | Mintlify 文档齐全 |
优势:
- 🎯 产出可执行的利用代码,而非仅仅告警
- 🎯 持续审计能力,适配 DevSecOps 流程
- 🎯 白盒测试能力,深入代码层面
- 🎯 开源免费,无商业许可限制
局限:
- ⚠️ 依赖 Claude API,需付费使用
- ⚠️ 主要针对 Web 应用,网络层测试能力有限
- ⚠️ 对目标系统有一定侵入性,生产环境需谨慎
适用场景:
- ✅ Web 应用安全测试
- ✅ CI/CD 流水线集成
- ✅ 持续安全审计
- ✅ 红队自动化测试
2️⃣ PentestGPT(GreyDGL/PentestGPT)
项目地址: https://github.com/GreyDGL/PentestGPT
核心特性
- LLM 赋能渗透测试工具,学术论文成果转化
- 终端用户界面 (TUI),交互式渗透测试
- 支持本地 LLM:Ollama、LM Studio、text-generation-webui
- CTF 挑战求解能力,实战验证
- 三模块自交互架构:推理、执行、验证
技术架构
PentestGPT 三模块架构:
┌──────────────────────────────────────────────┐
│ 推理模块 (Reasoning) │
│ - 任务分解 │
│ - 策略规划 │
│ - 知识检索 │
└──────────────────────────────────────────────┘
↓
┌──────────────────────────────────────────────┐
│ 执行模块 (Execution) │
│ - 工具调用 (Nmap, SQLmap, etc.) │
│ - 命令生成 │
│ - 结果收集 │
└──────────────────────────────────────────────┘
↓
┌──────────────────────────────────────────────┐
│ 验证模块 (Validation) │
│ - 结果验证 │
│ - 漏洞确认 │
│ - 报告生成 │
└──────────────────────────────────────────────┘
集成能力
- ✅ 支持多种 LLM:GPT-4、Claude、本地模型
- ✅ 预集成安全工具:Nmap、SQLmap、Burp 等
- ✅ CTF 挑战自动化求解
- ✅ 渗透测试报告自动生成
深度评价
| 维度 | 评分 | 说明 |
|---|---|---|
| 自动化程度 | ⭐⭐⭐⭐ | 半自主,需人工确认关键步骤 |
| 漏洞发现率 | ⭐⭐⭐⭐ | CTF 实战验证有效 |
| 误报率 | ⭐⭐⭐⭐ | 验证模块降低误报 |
| 易用性 | ⭐⭐⭐⭐ | TUI 界面友好 |
| 社区活跃度 | ⭐⭐⭐⭐⭐ | GitHub 10k+ stars |
| 文档完善度 | ⭐⭐⭐⭐ | 学术论文 + 技术文档 |
优势:
- 🎯 学术研究背景,方法论严谨
- 🎯 支持本地 LLM,数据隐私可控
- 🎯 CTF 实战验证,技术可靠
- 🎯 完全开源,无商业限制
- 🎯 社区活跃,持续更新
局限:
- ⚠️ 需要一定渗透测试基础知识
- ⚠️ 本地 LLM 性能影响测试效果
- ⚠️ 主要针对 Web 和 CTF 场景
适用场景:
- ✅ CTF 竞赛辅助
- ✅ 渗透测试学习
- ✅ 中小企业安全测试
- ✅ 隐私敏感环境(本地 LLM)
3️⃣ Strix(usestrix/strix)
项目地址: https://github.com/usestrix/strix
核心特性
- 自主 AI 黑客代理,模拟真实黑客行为
- 动态代码执行,实时漏洞验证
- PoC 生成,产出概念验证代码
- CI/CD 流水线集成
- 多代理协作,分工执行不同任务
技术架构
Strix 多代理架构:
┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ 侦察代理 │ │ 利用代理 │ │ 报告代理 │
│ Recon Agent │ │ Exploit Agent│ │ Report Agent│
└─────────────┘ └─────────────┘ └─────────────┘
↓ ↓ ↓
信息收集 漏洞利用 报告生成
集成能力
- ✅ OpenAI GPT 系列支持
- ✅ CI/CD 集成(GitHub Actions、GitLab CI)
- ✅ 代码仓库扫描
- ✅ Web 应用扫描
深度评价
| 维度 | 评分 | 说明 |
|---|---|---|
| 自动化程度 | ⭐⭐⭐⭐ | 自主执行,可配置人工审核点 |
| 漏洞发现率 | ⭐⭐⭐⭐ | 动态验证提高准确率 |
| 误报率 | ⭐⭐⭐⭐ | 实际利用验证降低误报 |
| 易用性 | ⭐⭐⭐⭐ | 配置简单,API 友好 |
| 社区活跃度 | ⭐⭐⭐⭐ | 2025 年 11 月发布,增长快 |
| 文档完善度 | ⭐⭐⭐⭐ | 文档齐全 |
优势:
- 🎯 模拟真实黑客行为,测试更贴近实战
- 🎯 动态验证,误报率低
- 🎯 CI/CD 集成,DevSecOps 友好
- 🎯 开源免费
局限:
- ⚠️ 相对较新(2025 年 11 月发布)
- ⚠️ 依赖 OpenAI API
- ⚠️ 主要针对代码仓库和 Web 应用
适用场景:
- ✅ 代码仓库安全扫描
- ✅ Web 应用渗透测试
- ✅ DevSecOps 流程集成
- ✅ 持续安全监控
4️⃣ PentAGI(vxcontrol/pentagi)
项目地址: https://github.com/vxcontrol/pentagi
核心特性
- 多智能体渗透测试系统
- 单容器部署,开箱即用
- 企业级功能,生产就绪
- SOCRadar 2025 AI 渗透测试工具 Top 10 第 4 名
- 深度自托管,栈可观测性
技术架构
PentAGI 多智能体架构:
┌─────────────────────────────────────────────────┐
│ 协调器 (Orchestrator) │
└─────────────────────────────────────────────────┘
↓ ↓ ↓ ↓
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│ 侦察代理 │ │ 扫描代理 │ │ 利用代理 │ │ 报告代理 │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
集成能力
- ✅ Docker 容器化部署
- ✅ 预集成安全工具链
- ✅ 可观测性集成(日志、指标)
- ✅ 可编程 API
深度评价
| 维度 | 评分 | 说明 |
|---|---|---|
| 自动化程度 | ⭐⭐⭐⭐⭐ | 全自主多智能体协作 |
| 漏洞发现率 | ⭐⭐⭐⭐ | 多代理协作提高覆盖率 |
| 误报率 | ⭐⭐⭐⭐ | 多阶段验证 |
| 易用性 | ⭐⭐⭐⭐⭐ | 单容器部署,开箱即用 |
| 社区活跃度 | ⭐⭐⭐⭐ | 企业级项目,稳定更新 |
| 文档完善度 | ⭐⭐⭐⭐ | 企业级文档 |
优势:
- 🎯 单容器部署,极简运维
- 🎯 多智能体协作,覆盖全面
- 🎯 企业级功能,生产就绪
- 🎯 深度自托管,数据可控
- 🎯 可观测性强,便于调试
局限:
- ⚠️ 资源消耗较大(多容器)
- ⚠️ 学习曲线较陡
- ⚠️ 社区相对较小
适用场景:
- ✅ 企业级安全测试
- ✅ 红队自动化
- ✅ 大规模资产扫描
- ✅ 合规审计
5️⃣ OWASP ZAP + AI(zaproxy/zaproxy)
项目地址: https://github.com/zaproxy/zaproxy
核心特性
- OWASP 旗舰项目,社区驱动
- DAST 扫描器,动态应用安全测试
- AI 增强漏洞检测(2025 年新增)
- Bug Bounty 狩猎增强
- 免费开源,无商业限制
AI 增强功能(2025 年更新)
- ✅ AI 辅助漏洞分类
- ✅ 智能扫描策略优化
- ✅ 误报过滤
- ✅ 漏洞优先级排序
- ✅ 自动化报告生成
深度评价
| 维度 | 评分 | 说明 |
|---|---|---|
| 自动化程度 | ⭐⭐⭐⭐ | 自动化扫描 + 人工验证 |
| 漏洞发现率 | ⭐⭐⭐⭐⭐ | OWASP 社区持续维护 |
| 误报率 | ⭐⭐⭐⭐ | AI 增强后显著降低 |
| 易用性 | ⭐⭐⭐⭐ | GUI + API 双模式 |
| 社区活跃度 | ⭐⭐⭐⭐⭐ | OWASP 旗舰项目 |
| 文档完善度 | ⭐⭐⭐⭐⭐ | 文档极其完善 |
优势:
- 🎯 OWASP 背书,社区强大
- 🎯 免费开源,无商业限制
- 🎯 文档完善,学习资源丰富
- 🎯 AI 增强后能力大幅提升
- 🎯 GUI + API 双模式,灵活使用
局限:
- ⚠️ AI 功能相对基础(相比专用 AI 工具)
- ⚠️ 需要一定安全测试知识
- ⚠️ 主要针对 Web 应用
适用场景:
- ✅ Web 应用安全测试
- ✅ Bug Bounty 狩猎
- ✅ 安全测试学习
- ✅ 合规扫描
📈 横向对比
功能对比表
| 功能 | Shannon | PentestGPT | Strix | PentAGI | ZAP+AI |
|---|---|---|---|---|---|
| 全自主测试 | ✅ | ⚠️ 半自主 | ✅ | ✅ | ❌ |
| 多智能体架构 | ✅ | ❌ | ✅ | ✅ | ❌ |
| 本地 LLM 支持 | ❌ | ✅ | ❌ | ✅ | ❌ |
| PoC 生成 | ✅ | ⚠️ 部分 | ✅ | ✅ | ❌ |
| CI/CD 集成 | ✅ | ❌ | ✅ | ✅ | ✅ |
| Docker 部署 | ✅ | ✅ | ✅ | ✅ | ✅ |
| 免费开源 | ✅ | ✅ | ✅ | ✅ | ✅ |
| 社区规模 | 大 | 很大 | 中 | 中 | 很大 |
| 文档完善度 | 好 | 好 | 好 | 好 | 极好 |
适用场景对比
| 场景 | 推荐工具 | 理由 |
|---|---|---|
| Web 应用持续审计 | Shannon | 96.15% 成功率,持续审计 |
| CTF/学习 | PentestGPT | CTF 验证,本地 LLM |
| DevSecOps 集成 | Strix | CI/CD 原生集成 |
| 企业级红队 | PentAGI | 多智能体,企业功能 |
| 入门/学习 | ZAP+AI | OWASP 背书,文档完善 |
| 隐私敏感环境 | PentestGPT | 本地 LLM 支持 |
| 快速部署 | PentAGI | 单容器开箱即用 |
| 代码仓库扫描 | Strix | 代码库深度集成 |
🎯 深度评价与趋势分析
技术趋势
-
全自主化:从辅助工具 → 自主代理
- 2025 年前:AI 辅助人工测试
- 2026 年:AI 自主执行完整渗透测试流程
-
多智能体协作:单一模型 → 多代理分工
- 侦察、扫描、利用、报告由不同代理负责
- 类似真实红队分工
-
可交付利用代码:从告警 → PoC
- 不仅报告漏洞,还生成可利用代码
- 大幅降低验证成本
-
持续审计:从年度测试 → 持续监控
- 集成 CI/CD,每次代码提交自动测试
- DevSecOps 成为标配
-
本地化部署:从云端 API → 本地 LLM
- 隐私敏感场景需求增长
- Ollama 等本地模型成熟
风险与挑战
| 风险 | 说明 | 应对建议 |
|---|---|---|
| 双刃剑效应 | 黑产同样可使用 AI 渗透工具 | 加强防御侧 AI 能力建设 |
| 误报/漏报 | AI 判断仍有误差 | 人工复核关键漏洞 |
| API 依赖 | 多数工具依赖商业 API | 评估本地部署方案 |
| 合规风险 | 自动化测试可能违反某些法规 | 确保授权测试 |
| 技能退化 | 过度依赖 AI 可能导致基础技能下降 | 保持人工测试能力 |
行业影响
-
渗透测试服务模式变革
- 年度测试 → 持续监控
- 人工为主 → AI 辅助/自主
- 高成本 → 成本大幅下降
-
安全团队能力要求变化
- 基础扫描技能需求下降
- AI 工具调优能力需求上升
- 漏洞验证与修复指导能力更重要
-
中小企业安全能力提升
- 零成本获取企业级测试能力
- 安全测试民主化
- 整体安全水位提升
💡 选型建议
个人/学习者
推荐:PentestGPT + ZAP+AI
- 学习资源丰富
- 本地 LLM 支持,零成本
- CTF 实战验证
中小企业
推荐:Shannon + ZAP+AI
- 开源免费
- 部署简单
- 持续审计能力
大型企业
推荐:PentAGI + Strix + Shannon
- 多工具组合,覆盖全面
- 企业级功能
- CI/CD 深度集成
红队/攻防演练
推荐:PentAGI + Shannon
- 全自主能力
- PoC 生成
- 多智能体协作
📚 参考资源
官方文档
- Shannon: https://mintlify.com/explore/KeygraphHQ/shannon
- PentestGPT: https://github.com/GreyDGL/PentestGPT
- Strix: https://github.com/usestrix/strix
- PentAGI: https://github.com/vxcontrol/pentagi
- OWASP ZAP: https://www.zaproxy.org/
技术文章
- Shannon: The Autonomous AI Pentester That Changes Web Security in 2026
- Strix: Open-source AI agents for penetration testing
- AI pentesting 2025 / 2026 with open source tools
行业报告
- SOCRadar Top 10 AI Pentest Tools 2025
- 2026 渗透测试行业全景解析
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)