Anthropic 给 Claude Code 装上了“安全刹车“：代码还没提交，漏洞先被拦下

ylscode

783人浏览 · 2026-05-27 12:52:33

ylscode · 2026-05-27 12:52:33 发布

AI 写代码的速度越来越快，安全问题却常常被甩在身后。不少开发者都有过这种经历：Claude 噼里啪啦生成了一堆功能代码，跑起来没问题，一到安全审查环节却爆出各种漏洞，返工成本极高。Anthropic 显然注意到了这个痛点，最近为 Claude Code 推出了一款安全指导插件，直接把防护网织进了编码现场。

这款插件最吸引人的地方在于"零门槛"——所有套餐用户都能免费使用，不需要额外付费。它不像传统安全工具那样等代码写完了再扫描，而是像一位时刻站在旁边的安全工程师，在代码诞生的过程中就不断挑刺。

三层防护，把漏洞堵在源头

整个插件的运作逻辑可以概括为"分阶段拦截"。它不会等到你提交 PR 才慢悠悠地给出一份漏洞报告，而是在编码会话的三个关键节点分别出手。

当你每次修改文件时，第一层防护立即启动。这里用的是确定性模式匹配，不需要调用大模型，所以完全不增加额外成本。它能瞬间标记出代码里的危险结构——比如可疑的 <script> 标签、反序列化操作、DOM 注入向量（像 eval()、new Function()、dangerouslySetInnerHTML 这类高风险写法），以及 os.system()、child_process.exec() 等系统命令调用。这一层相当于快速安检，先把最明显的风险筛出去。

真正的杀招在第二层。每个对话回合结束后，一个独立于主编码模型的后台 Claude 模型会登场。它会完整审视这一轮会话产生的所有代码变更，从 git diff 里逐行分析。由于这个"审查员"没有参与之前的编码过程，视角完全新鲜，能发现字符串匹配根本抓不到的逻辑级漏洞：授权绕过、不安全的直接对象引用、服务器端请求伪造、弱加密实现——这些往往需要理解业务逻辑才能察觉的隐患，恰恰是传统静态扫描工具的盲区。

到了提交或推送环节，第三层代理审查进一步深挖。它会读取调用者上下文、清理器逻辑和相关文件，把误报压到最低。内部测试数据显示，这套组合拳让 PR 中的安全相关评论减少了 30% 到 40%，相当于把大量事后扯皮前置到了编码当场解决。

Code Review Checklist for AI-Generated Code - ClackyAI Blog

装起来只需一条命令，配起来却很灵活

在 Claude Code 会话里敲一行指令就能装上这款插件：

/plugin install security-guidance@claude-plugins-official /reload-plugins

装完后，开发者可以通过两个仓库级文件来调教它的行为。.claude/claude-security-guidance.md 负责给模型审查员灌输你团队特有的威胁模型规则，用自然语言描述哪些业务逻辑属于高危操作；.claude/security-patterns.yaml 则用来定义自定义正则或子字符串模式，补充到每次编辑检查的检测库中。

如果是团队使用，管理员可以在 .claude/settings.json 里声明强制启用，直接推送给整个组织，确保没人漏装。插件要求 Claude Code CLI 版本不低于 2.1.144，系统里要有 Python 3.8+。首次运行会自动在 ~/.claude/security/ 创建虚拟环境，把代理提交审查所需的 Claude Agent SDK 装好。

默认情况下，回合结束审查和提交审查调用的是 Claude Opus 4.7，但开发者可以通过环境变量 SECURITY_REVIEW_MODEL 和 SG_AGENTIC_MODEL 切换成其他模型，按需平衡成本与深度。

Claude Code Security Best Practices - Backslash

金融巨头买账，开源社区跟进

这种"安全左移"的思路在业界已经引起了不小的反响。摩根大通的 Shalini Goyal 等多位高管公开表达了对该模式的认可——把安全指导直接融进编码环节，而不是依赖后续审查流程，能从根本上降低漏洞流入生产环境的几率。

Anthropic 还在 GitHub 上开源了参考仓库 anthropics/claude-code-security-review，展示代理如何自主发现和修复问题。目前这套开源方案已经支持 SQL 注入、XSS、反序列化导致的远程代码执行、不安全的直接对象引用以及硬编码凭据检测等常见漏洞类型。

不过需要明确的是，这款插件的定位是纵深防御体系中的一环，而非完整的安全解决方案。它不会强行阻止你写入或提交代码，发现的问题会以指令形式抛回给 Claude，让其在同一会话中当场修复。这种设计既保留了开发者的控制权，又确保了安全问题不会被遗忘在角落。

A short overview of WordPress Security plugins - Easy Web Design Tutorials

Claude Code by Anthropic | AI Coding Agent, Terminal, IDE

写在最后

AI 辅助编程正在从"快"走向"又快又稳"。Anthropic 这次把安全审查能力插件化、实时化，本质上是在回答一个关键问题：当 AI 能写代码时，谁来审查 AI？答案似乎是——让另一个 AI 在过程中持续盯着。对于每天都在和 Claude Code 打交道的开发者来说，这款免费插件或许能成为防止"翻车"的最后一道保险。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

不想玩openclaw了？国产大厂推出的openclaw平替：stepclaw深度评测，桌面、云端+悬浮窗，是你的菜吗？

AtomGit开源社区

AI与质性研究的融合（五）：质性研究论文写作模板——从结果到讨论的完整结构

质性论文写作的关键在于如何将分析结果转化为有层次的学术论证。研究者在结果部分常犯主题罗列、引文堆砌或过度抽象的错误，应采用"主题-证据-解释"结构，呈现发现的同时为讨论埋下线索。讨论部分需完成解释发现、连接文献、提升理论层次和说明意义四大任务，避免沦为文献复述或空谈意义。结果与讨论之间应保持逻辑衔接，通过机制解释、概念提炼或差异分析实现自然过渡。质性写作的核心能力包括概念提炼、

AtomGit开源社区

AI与质性研究的融合（四）：AI提升学术写作与发表

质性研究写作面临材料丰富但表达不足的困境，AI可有效辅助研究者提升论文质量。文章指出质性写作需处理经验、解释、结构和发表四重复杂性，AI能在结构梳理、段落重组、语言润色等环节发挥作用，但前提是研究者需先有清晰逻辑。具体提出AI赋能写作的六个环节：论文结构搭建、引言写作、结果与讨论组织、理论贡献提炼、语言优化和投稿匹配，并强调需保持作者声音。最后给出AI辅助的九步工作流，从明确论点到传播扩散，帮助研