AI 写代码的速度越来越快,安全问题却常常被甩在身后。不少开发者都有过这种经历:Claude 噼里啪啦生成了一堆功能代码,跑起来没问题,一到安全审查环节却爆出各种漏洞,返工成本极高。Anthropic 显然注意到了这个痛点,最近为 Claude Code 推出了一款安全指导插件,直接把防护网织进了编码现场。

这款插件最吸引人的地方在于"零门槛"——所有套餐用户都能免费使用,不需要额外付费。它不像传统安全工具那样等代码写完了再扫描,而是像一位时刻站在旁边的安全工程师,在代码诞生的过程中就不断挑刺。

三层防护,把漏洞堵在源头

整个插件的运作逻辑可以概括为"分阶段拦截"它不会等到你提交 PR 才慢悠悠地给出一份漏洞报告,而是在编码会话的三个关键节点分别出手。

当你每次修改文件时,第一层防护立即启动。这里用的是确定性模式匹配,不需要调用大模型所以完全不增加额外成本。它能瞬间标记出代码里的危险结构——比如可疑的 <script> 标签、反序列化操作、DOM 注入向量(像 eval()new Function()dangerouslySetInnerHTML 这类高风险写法),以及 os.system()child_process.exec() 等系统命令调用。这一层相当于快速安检,先把最明显的风险筛出去。

真正的杀招在第二层。每个对话回合结束后,一个独立于主编码模型的后台 Claude 模型会登场。它会完整审视这一轮会话产生的所有代码变更,从 git diff 里逐行分析。由于这个"审查员"没有参与之前的编码过程,视角完全新鲜能发现字符串匹配根本抓不到的逻辑级漏洞:授权绕过、不安全的直接对象引用、服务器端请求伪造、弱加密实现——这些往往需要理解业务逻辑才能察觉的隐患,恰恰是传统静态扫描工具的盲区

到了提交或推送环节,第三层代理审查进一步深挖。它会读取调用者上下文、清理器逻辑和相关文件,把误报压到最低。内部测试数据显示,这套组合拳让 PR 中的安全相关评论减少了 30% 到 40%,相当于把大量事后扯皮前置到了编码当场解决。

Code Review Checklist for AI-Generated Code - ClackyAI Blog

装起来只需一条命令,配起来却很灵活

在 Claude Code 会话里敲一行指令就能装上这款插件:

/plugin install security-guidance@claude-plugins-official /reload-plugins

装完后,开发者可以通过两个仓库级文件来调教它的行为。.claude/claude-security-guidance.md 负责给模型审查员灌输你团队特有的威胁模型规则,用自然语言描述哪些业务逻辑属于高危操作;.claude/security-patterns.yaml 则用来定义自定义正则或子字符串模式补充到每次编辑检查的检测库中。

如果是团队使用,管理员可以在 .claude/settings.json 里声明强制启用,直接推送给整个组织,确保没人漏装。插件要求 Claude Code CLI 版本不低于 2.1.144系统里要有 Python 3.8+。首次运行会自动在 ~/.claude/security/ 创建虚拟环境,把代理提交审查所需的 Claude Agent SDK 装好。

默认情况下,回合结束审查和提交审查调用的是 Claude Opus 4.7,但开发者可以通过环境变量 SECURITY_REVIEW_MODELSG_AGENTIC_MODEL 切换成其他模型,按需平衡成本与深度。

Claude Code Security Best Practices - Backslash

金融巨头买账,开源社区跟进

这种"安全左移"的思路在业界已经引起了不小的反响。摩根大通的 Shalini Goyal 等多位高管公开表达了对该模式的认可——把安全指导直接融进编码环节,而不是依赖后续审查流程能从根本上降低漏洞流入生产环境的几率。

Anthropic 还在 GitHub 上开源了参考仓库 anthropics/claude-code-security-review,展示代理如何自主发现和修复问题。目前这套开源方案已经支持 SQL 注入、XSS、反序列化导致的远程代码执行、不安全的直接对象引用以及硬编码凭据检测等常见漏洞类型。

不过需要明确的是,这款插件的定位是纵深防御体系中的一环,而非完整的安全解决方案。它不会强行阻止你写入或提交代码,发现的问题会以指令形式抛回给 Claude,让其在同一会话中当场修复。这种设计既保留了开发者的控制权又确保了安全问题不会被遗忘在角落。

A short overview of WordPress Security plugins - Easy Web Design Tutorials

Claude Code by Anthropic | AI Coding Agent, Terminal, IDE

写在最后

AI 辅助编程正在从"快"走向"又快又稳"。Anthropic 这次把安全审查能力插件化、实时化,本质上是在回答一个关键问题:当 AI 能写代码时,谁来审查 AI答案似乎是——让另一个 AI 在过程中持续盯着。对于每天都在和 Claude Code 打交道的开发者来说,这款免费插件或许能成为防止"翻车"的最后一道保险。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐