【技术分享】佬友想知道更多skill转agent方案 - 和解决安全问题
前几天发了2个讨论新的开发agent的方法的帖子,很多佬有问题想讨论,那么我就这里讨论和交换意见,不一一回复了:
前几天介绍了3个方法转skills为web agent saas, 今天介绍最强大的方法: claude agent sdk Claude Agent SDK 的本质是 Anthropic 提供的开发工具包,核心功能是让开发者能用 Python/TypeScript 轻松构建基于 Claude Code的 AI Agent(智能体),并且原生支持工具调用和多步骤推理。 本项目目的是基于已经跑…
1 首先,claude agent sdk 和 codex agent sdk 都是主流而且应该就是未来最重要的agent框架,而不是过去那些。当然 langchain的 deepagents和字节的deerflow 应该也是目前重要的技术方案。关键是看哪个生态会更可能发展起来,我觉得是 :claude agent sdk 和 codex agent sdk 。
为什么未来核心是skills?
如果底层 Agent 越来越通用,下一步还要为每个行业、每个场景、每家公司重新做一个 Agent 吗?Anthropic 给出的答案是:不要继续重做 Agent,开始做 Skills。简单说,Agent 负责思考和执行,Skills 负责把专业知识、流程经验和做事方法打包给它。所以,当 Agent 越来越强,真正缺的不再是一个新的 Agent,而是让 Agent 学会某个行业、某家公司、某个团队怎么做事的 Skills。
2, 这些claude agent sdk 和 codex agent sdk 的agent开发,我们主要开发和利用的其实就是平时使用的skills。skills就是开发的核心,所以也可以说,根本不需要开发,因为skills本来自己就有了,利用这些agent框架封装一下,就变成web saas应用给大众使用。
参考文档:Quickstart - Claude Code Docs
3,佬友讨论的安全问题,所以这就是生态的重要性,我们遇到的问题早就有大神和官方或者生态解决了,不需要总是自己思考和解决。
参考文档:Securely deploying AI agents - Claude Code Docs
五层防御方案:
image
image1407×528 28.4 KB
权限管理:
image
image1602×624 32.9 KB
Docker 容器:
image
image1488×882 45.1 KB
llamafirewall 护栏防火墙:
image
image831×221 35.2 KB
LlamaFirewall 综合安全护栏
三层防护:
-
输入层 :检测 Prompt 注入攻击
-
输出层 :确保 Agent 的回答符合安全策略
-
工具层 :控制 Agent 能访问哪些工具、哪些数据
Apex 红队测试
动手实操的 Agent 安全测试教程:
-
模拟 Prompt 注入攻击
-
测试防御机制的有效性
-
自动化安全评估流程
安全加固后架构 ,这样:
┌──────────────────────────────────────────────────────────────────────┐ │ 安全加固后架构 │ │ │ │ ┌──────────┐ ┌──────────────┐ ┌─────────────────────────┐ │ │ │ Frontend │────▶│ Bun Server │────▶│ Permission Gateway │ │ │ │ (React) │◀────│ (index.ts) │◀────│ (canUseTool 回调) │ │ │ └──────────┘ └──────┬───────┘ └────────────┬────────────┘ │ │ │ │ │ │ │ ✅ 第二层: │ │ │ 工具权限白名单 │ │ │ + 命令 AST 解析 │ │ │ │ │ │ ┌─────▼──────────────────────────▼──────────┐ │ │ │ Agent 运行环境 │ │ │ │ │ │ │ │ ✅ 第三层:沙箱隔离 │ │ │ │ ┌──────────────────────────────────────┐ │ │ │ │ │ sandbox-runtime / Docker 容器 │ │ │ │ │ │ │ │ │ │ │ │ • 只读挂载必要目录 │ │ │ │ │ │ • 网络仅允许 API 代理 │ │ │ │ │ │ • 文件系统限制在 workspace 内 │ │ │ │ │ │ • 无特权用户运行 │ │ │ │ │ │ │ │ │ │ │ │ Claude Agent SDK (受限模式) │ │ │ │ │ │ • permissionMode: 'default' │ │ │ │ │ │ • disallowedTools + canUseTool │ │ │ │ │ └──────────────────────────────────────┘ │ │ │ └────────────────────────────────────────────┘ │ │ │ │ │ ┌─────▼──────────────────┐ │ │ │ ✅ 第一层: │ │ │ │ API 代理 (Credential │ │ │ │ Proxy) │ │ │ │ • 注入 ANTHROPIC_API_KEY│ │ │ │ • 域名白名单 │ │ │ │ • 流量审计日志 │ │ │ └─────────────────────────┘ │ │ │ │ ┌─────────────────────────────────────────────────────────────┐ │ │ │ ✅ 第四层:LlamaFirewall 语义护栏 │ │ │ │ • PromptGuard(输入扫描) │ │ │ │ • CodeShield(输出扫描) │ │ │ └─────────────────────────────────────────────────────────────┘ │ │ │ └──────────────────────────────────────────────────────────────────────┘
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐






所有评论(0)