AI 安全进化史：从“脚本小子”到自主渗透的 Agent 战争

花果山~~程序猿

246人浏览 · 2026-06-07 16:48:51

花果山~~程序猿 · 2026-06-07 16:48:51 发布

摘要

本文基于 B 站视频内容，系统梳理了 AI 在网络安全领域从 2022 年底到 2026 年的进化历程。文章涵盖了 AI 早期在渗透测试中的四大困境（知识截止、无法执行命令、无状态、缺乏攻击思维），到 Function Calling、MCP 协议、Skills 体系等技术突破如何逐步赋予 AI 自主渗透能力。最后，文章介绍了开源项目 VulnCloud，展示了一个专为国内安全场景设计的 AI 驱动渗透测试框架，并探讨了 AI 对安全行业门槛、效率与攻防格局的深远影响。

技术关键词

AI Agent、渗透测试、MCP 协议、Skills 体系、Function Calling、CTF、漏洞发现、安全自动化、VulnCloud、越狱插件

核心观点

AI 安全能力飞跃：从 2022 年底连简单 SQL 注入都完成不了，到 2026 年能自主打穿靶场、拿下 root 权限，AI 在安全领域的进化速度惊人。
技术突破是关键：Function Calling、MCP 协议、Skills 体系三大技术突破，让 AI 从“理论家”变成了“实战者”。
安全生态双刃剑：MCP 和 Skills 在带来便利的同时，也引入了供应链安全风险（如恶意 Skill、MCP 服务器劫持）。
行业门槛降低：AI 使低技能攻击者能快速放大攻击能力，渗透测试从“经验积累”转向“工具+AI 驱动”。
效率碾压：AI 在重复劳动（如报告生成）上碾压人类，漏洞从披露到被利用的时间中位数从 32 天压缩到 5 天。
拥抱而非抗拒：AI 不会取代安全研究员，但会用 AI 的安全研究员会取代不会用的。

1. 早期 AI 渗透的四大困境（2022-2023）

在 ChatGPT 刚发布的 2022 年底，安全圈尝试用 AI 挖漏洞，结果发现它像个“纸上谈兵”的专家——理论强、实战崩。主要存在以下四个问题：

1.1 知识截止

AI 只知道训练数据截止前的知识。比如分析 CVE 漏洞时，它可能编造一个不存在的 CVE 编号，或者影响版本完全错误。幻觉问题严重，一半以上的建议可能是虚构的。

1.2 无法执行命令

AI 能告诉你“建议用 Nmap 扫描端口”或“用 SQLmap 测试注入”，但它自己无法执行这些命令。它像一个脑子里有无限编程知识、但没有电脑的人。

1.3 无状态

每次对话都是全新的开始，没有记忆，没有上下文。无法做持续性的渗透测试——关掉对话后，一切归零。

1.4 缺乏攻击思维

安全圈有句话叫“Think like an attacker”，但早期 GPT 更像蓝队（防守方）。它能告诉你代码是否符合安全规范，但不会主动去想“如果我故意绕过这个检查会怎样”。它是个理论扎实、实战拉胯的“书呆子黑客”。

2. 转折点：Function Calling 与 MCP 协议

2.1 Function Calling：给 AI 配上电脑

2023 年中，OpenAI 推出 Function Calling 功能。这相当于给那个“脑子里有知识但没电脑”的人配了一台电脑，AI 终于可以开始操作了：

查 CVE：以前只能回答“我的知识截止到 X 年”，现在可以调用 API 查最新漏洞库。
端口扫描：以前只能回答“我无法直接扫描”，现在可以调用 Nmap 工具。
SQL 注入测试：以前只能给理论建议，现在可以直接调用 SQLmap 返回测试结果。

但新问题出现了：每个平台的工具调用格式不同——OpenAI 有 OpenAI 的格式，Claude 有 Claude 的格式，国产模型又是另一套。没有统一标准，工具开发一次只能适配一个模型。

2.2 MCP 协议：统一工具调用的标准

2024 年 11 月，Anthropic 发布了 MCP 协议（Model Context Protocol）。这就像给所有 AI 模型和工具之间定义了一个“USB-C 接口”——工具只需要开发一次，就能被所有支持 MCP 的 AI 模型调用。

MCP 在安全圈的传播极快，安全工具开始大规模 MCP 化：

fetch：发 HTTP 请求，测试边界
Chrome DevTools：浏览器自动化，XSS 测试
Burp Suite：抓包重放
Frida MCP：移动端 Hook
ADB MCP：控制安卓设备
JD-GUI MCP：反编译
IDAPRO MCP：二进制逆向

整个安全工具链开始以 MCP 为纽带连接起来，生态以前所未有的速度繁荣。

3. Skills 体系：让 AI 像专家一样工作

3.1 什么是 Skills

如果说 MCP 解决的是“AI 怎么调用工具”的问题，那么 Skills 解决的就是“AI 怎么像专家一样工作”的问题。每个 Skill 是一个预定义的能力模块，包含：

该领域的知识库
操作流程
最佳实践

AI 调用 Skill，就像人类阅读了一篇操作文档，然后按照文档指引执行。例如：

Recon（信息收集）Skill：包含信息收集方法论、指纹库、探测顺序建议
Vuln Discovery（漏洞发现）Skill：包含漏洞分析体系、测试优先级排序、验证方法论
WAF Bypass Skill：包含各种 WAF 绕过技巧、编码方式、分割思路

3.2 Skills 的安全隐患

2026 年 2 月，Sink 对近 4000 个 AI Skills 做了系统性安全扫描，结果：

超过 1/3 存在安全问题（1467 个有漏洞或恶意代码）
存在真实的恶意样本

给 AI 安装一个 Skill，本质上是让 AI 执行一段第三方提供的代码。如果 Skill 本身有问题，AI 可能：

读取敏感数据并悄悄外传
开后门反弹 Shell
把 MCP 工具链变成攻击者的跳板

OWASP 随后发布了 Agent Skill Top 10，列举了各种 Skills 相关安全风险：不安全的来源、权限过度、Prompt 注入、数据泄露、供应链依赖、身份冒充、持久化威胁、横向移动、绕过安全控制等。

4. AI Agent 的自主渗透时代（2025-2026）

4.1 Agent 的三大特征

真正的 AI Agent 不是那种“加了几个工具调用就算 agent”的玩具，而是具备以下三个特征：

多轮自主循环：不是一问一答就结束，而是 AI 自己规划下一步、自己执行、自己评估结果、再自己判断继续推进。
主动规划并执行：给一个目标，它能自动拆解任务——先信息收集，再端口扫描，然后漏洞探测，再尝试利用和权限提升，最后生成报告。不需要每一步都确认。
持久化执行：可以跑几十轮、上百轮，持续进行渗透，中途可以看到它的思考过程和每一步操作。

4.2 渗透测试三阶段对比

5. 行业影响：门槛降低与效率提升

5.1 CTF 比赛中的 AI Agent

CSAW 专门办了 Agentic Automatic CTF 比赛，参赛者需构建能自主解题的 AI Agent。
论文《The World’s Top AI Agent for Security CTF》直接把 AI 在 CTF 中的表现作为正式研究方向，其中甚至有一节叫“Feasibility of Domination”。

5.2 漏洞发现与利用加速

Cloud Security Alliances 的研究显示，大模型已能自主发现并复现此前未知的可利用漏洞（0day）。
EPFL 研究团队验证了 500 多个高位的 0day，后续模型还找到了更多。
漏洞从公开披露到被利用的中位数时间，从过去的约 32 天压缩到了约 5 天。

5.3 渗透测试报告自动化

CyberCORE 数据显示，使用 AI 后，渗透测试报告整体出报告时间平均缩短 50%。
单份报告从 4-14 小时压缩到 2-5 小时。
原来 50%-70% 的报告时间花在复制粘贴上，用 AI 后降到 16%-20%。
AI 不会疲倦、不会情绪波动、不会因熬夜判断力下降，在规模化场景中优势巨大。

6. 开源实践：VulnCloud 项目

6.1 项目定位

VulnCloud 是一个专为国内安全场景设计的 AI 驱动渗透测试 CLI 工具，定义为“AI 驱动的渗透测试 CLI 工具”，即一个用于 AI 渗透测试的 Agent 智能体。同时增加了 CTF 功能，可帮助找 Flag。

6.2 技术架构

6.3 核心功能

7 个核心 Skill：PenTestFlow（全流程编排）、Recon（信息收集）、VulnDiscovery（漏洞发现）、Exploitation（漏洞利用）、PostExploitation（后渗透）、Reporting（报告生成）、WAFBypass（WAF 绕过）
13 个专项 Skill：Web PenTest、Android PenTest、Client Reverse、Web Security Advanced、AI MCP Security、Intranet PenTest、Advanced PenTest Tools、Rapid Checklist、Crypto CTF、Web CTF、Misc CTF Recon 等
编解码工具：内置 29 种编解码和加解密工具，包括 Base64/32/58、Hex、URL、HTML、Unicode、ROT13、Caesar、MD5、SHA256/512、AES、JWT 等，最实用的是 auto_decode 自动尝试常见编解码
LLM 支持：支持 8 个模型（OpenAI、MiniMax、DeepSeek、智谱、Moonshot、通义千问、SiliconFlow），支持自定义配置

6.4 特色设计

持续性渗透测试：默认 100 轮对话一个周期，最多持续 10 个周期（共 1000 轮），带死循环检测
推理可视化：think_on / think_off 一键切换，可看到 AI 思考过程
沙盒模式：内置安全提示词，防止 AI 进行危险操作（如过度激进的提权）
自动报告和 POC 生成：渗透测试结束后自动输出 Markdown 格式报告和 Python POC 脚本

7. 总结与展望

两年前，AI 连最简单的 SQL 注入都打不明白；两年后，AI 攻击队已经达到中上游甚至一流实战水平，能自主打穿靶场、拿下 root 权限。纯人工队伍逐渐抵不过 AI 加持的队伍，零基础新人靠 Skill 加越狱也能达到资深水平。

下一步，AI Agent 的自主渗透能力会继续提升，MCP 和 Skills 的安全标准会进一步完善，整个生态会继续成熟。AI 不会取代安全研究员，但是会用 AI 的安全研究员会取代不会用的。

思维导图

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

基于神经网络的汽车与自行车的分类算法设计与实现，采用ResNet50和迁移学习，准确率达到99%

AtomGit开源社区

曲辕RPA-AI自动搭建流程

摘要：曲辕RPA通过AI自动搭建流程功能实现零学习成本，用户可通过对话描述需求自动生成RPA流程，支持持续优化和错误修复。系统提供元素捕获辅助、流程分析、指令教学等功能，支持手动与AI混合编辑。建议使用高版本（RPA≥8.9.0）并配置优质大语言模型以获得最佳效果，遇到问题可尝试重新提问或切换思考模式。不推荐使用上下文较短的glm-5.1和kimi-2.6模型。

AtomGit开源社区

【空间压榨到倒计时】真 · O(1) 原地起飞：我与 AI 死磕 LeetCode 1260 的 6 阶进化录

从最初粗糙的 K次单步模拟到直觉的二维分块翻车；看到官方完美的一维映射新矩阵解法；被激发出空间强迫症，跨越空间鸿沟推导出了真 · O(1) 空间的环状多米诺置换（DFS与纯迭代）；惊叹于 AI 抛出的三次翻转美学；最终，用最大公约数（GCD）定理在数论层面实现终极闭环。刷题的乐趣从来不在于 AC 数量的堆砌，而在于你能不能在一个看似简单的官方及格方案后面，把问题的底层物理结构和数学本