【技术分享】佬友想知道更多skill转agent方案 - 和解决安全问题

liangdabiao

86人浏览 · 2026-05-25 23:27:30

liangdabiao · 2026-05-25 23:27:30 发布

前几天发了2个讨论新的开发agent的方法的帖子，很多佬有问题想讨论，那么我就这里讨论和交换意见,不一一回复了：

前几天介绍了3个方法转skills为web agent saas, 今天介绍最强大的方法： claude agent sdk Claude Agent SDK 的本质是 Anthropic 提供的开发工具包，核心功能是让开发者能用 Python/TypeScript 轻松构建基于 Claude Code的 AI Agent（智能体），并且原生支持工具调用和多步骤推理。本项目目的是基于已经跑…

1 首先，claude agent sdk 和 codex agent sdk 都是主流而且应该就是未来最重要的agent框架，而不是过去那些。当然 langchain的 deepagents和字节的deerflow 应该也是目前重要的技术方案。关键是看哪个生态会更可能发展起来，我觉得是：claude agent sdk 和 codex agent sdk 。

为什么未来核心是skills?

如果底层 Agent 越来越通用，下一步还要为每个行业、每个场景、每家公司重新做一个 Agent 吗？Anthropic 给出的答案是：不要继续重做 Agent，开始做 Skills。简单说，Agent 负责思考和执行，Skills 负责把专业知识、流程经验和做事方法打包给它。所以，当 Agent 越来越强，真正缺的不再是一个新的 Agent，而是让 Agent 学会某个行业、某家公司、某个团队怎么做事的 Skills。

2, 这些claude agent sdk 和 codex agent sdk 的agent开发，我们主要开发和利用的其实就是平时使用的skills。skills就是开发的核心，所以也可以说，根本不需要开发，因为skills本来自己就有了，利用这些agent框架封装一下，就变成web saas应用给大众使用。
参考文档：Quickstart - Claude Code Docs

3，佬友讨论的安全问题，所以这就是生态的重要性，我们遇到的问题早就有大神和官方或者生态解决了，不需要总是自己思考和解决。
参考文档：Securely deploying AI agents - Claude Code Docs

五层防御方案：

image

image1407×528 28.4 KB

image

权限管理：

image

image1602×624 32.9 KB

image

Docker 容器：

image

image1488×882 45.1 KB

image

llamafirewall 护栏防火墙：

image

image831×221 35.2 KB

image

LlamaFirewall 综合安全护栏

三层防护：

输入层 ：检测 Prompt 注入攻击
输出层 ：确保 Agent 的回答符合安全策略
工具层 ：控制 Agent 能访问哪些工具、哪些数据

Apex 红队测试

动手实操的 Agent 安全测试教程：

模拟 Prompt 注入攻击
测试防御机制的有效性
自动化安全评估流程

安全加固后架构，这样：

┌──────────────────────────────────────────────────────────────────────┐ │ 安全加固后架构 │ │ │ │ ┌──────────┐ ┌──────────────┐ ┌─────────────────────────┐ │ │ │ Frontend │────▶│ Bun Server │────▶│ Permission Gateway │ │ │ │ (React) │◀────│ (index.ts) │◀────│ (canUseTool 回调) │ │ │ └──────────┘ └──────┬───────┘ └────────────┬────────────┘ │ │ │ │ │ │ │ ✅ 第二层： │ │ │ 工具权限白名单 │ │ │ + 命令 AST 解析 │ │ │ │ │ │ ┌─────▼──────────────────────────▼──────────┐ │ │ │ Agent 运行环境 │ │ │ │ │ │ │ │ ✅ 第三层：沙箱隔离 │ │ │ │ ┌──────────────────────────────────────┐ │ │ │ │ │ sandbox-runtime / Docker 容器 │ │ │ │ │ │ │ │ │ │ │ │ • 只读挂载必要目录 │ │ │ │ │ │ • 网络仅允许 API 代理 │ │ │ │ │ │ • 文件系统限制在 workspace 内 │ │ │ │ │ │ • 无特权用户运行 │ │ │ │ │ │ │ │ │ │ │ │ Claude Agent SDK (受限模式) │ │ │ │ │ │ • permissionMode: 'default' │ │ │ │ │ │ • disallowedTools + canUseTool │ │ │ │ │ └──────────────────────────────────────┘ │ │ │ └────────────────────────────────────────────┘ │ │ │ │ │ ┌─────▼──────────────────┐ │ │ │ ✅ 第一层： │ │ │ │ API 代理 (Credential │ │ │ │ Proxy) │ │ │ │ • 注入 ANTHROPIC_API_KEY│ │ │ │ • 域名白名单 │ │ │ │ • 流量审计日志 │ │ │ └─────────────────────────┘ │ │ │ │ ┌─────────────────────────────────────────────────────────────┐ │ │ │ ✅ 第四层：LlamaFirewall 语义护栏 │ │ │ │ • PromptGuard（输入扫描） │ │ │ │ • CodeShield（输出扫描） │ │ │ └─────────────────────────────────────────────────────────────┘ │ │ │ └──────────────────────────────────────────────────────────────────────┘

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

酒店门锁V10SDK接口Delphi-幽冥大陆(一百24)—东方仙盟

AtomGit开源社区

为什么我开发了 Pollinations AI 演示网站

AtomGit开源社区

Linux中配置DNS全过程

DNS (Domain Name System) 是域名服务，它是由解析器和域名服务器组成的。域名服务器是指保存有该网络中所有主机的域名和对应IP地址，并具有将域名转换为IP地址功能的服务器。（将网址解析成IP，或者将IP解析成网址）将域名映射为IP地址的过程就称为"域名解析"。在Internet上域名与IP地址之间是一对一(或者多对一)的，也可采用DNS轮循实现一对多，域名虽然便于人们记忆，