AI 核心概念从头梳理

视频来源AI的核心概念从头梳理 | LLM、Prompt、Agent、RAG、MCP、Skill、Context、Harness Engineering
作者:御豪同学 | 发布:2026-04-22 | 时长:49:08


一、核心框架:三层架构

理解所有 AI 概念的钥匙是 “模型 + 工程 + 应用” 三层架构:

🧠 模型层(Model Layer)

LLM 大语言模型

Embedding Model

Multimodal Model

⚙️ 工程层(Engineering Layer)

Prompt Engineering

Context Engineering

AI Agent

RAG

MCP / Tool

Workflow

Skill

Harness Engineering

🖥️ 应用层(Application Layer)

AI 产品 / Copilot

自动化系统

智能助手


二、大模型的本质:一个函数

输入

输出

追加到 Context

📋 Context Window
(System Prompt
+ 历史对话
+ 用户输入
+ 工具返回
+ RAG检索结果)

🧠 LLM
f(context)

🔤 Next Token
(循环输出)

核心洞察:模型本身无状态,所有"智能"体现都依赖 Context 的质量。


三、Prompt → Context Engineering 演进

方法论化

扩展范围

工程化落地

Prompt
基础输入

Prompt Engineering
系统优化输入

Context Engineering
管理整个上下文窗口

Harness Engineering
构建可靠 Agent 系统


四、AI Agent 架构(ReAct 循环)

Memory Tool LLM Agent Memory Tool LLM Agent loop [执行循环] User 输入任务 读取长期记忆(RAG) 组装 Context,发起推理 Thought + Action 调用工具(MCP/Function Call) Observation(工具返回) 更新短期记忆(Context) 继续推理 判断:继续行动 or 输出结果 最终答案 User

五、Memory 体系:短期 vs 长期

🗄️ 长期记忆(Long-term Memory)= RAG

⚡ 短期记忆(Short-term Memory)

向量化

注入 Context

Context Window
会话期间有效
受 Token 限制

知识库 / 文档

向量数据库
(Embedding 存储)

检索器(Retriever)

用户问题

🧠 LLM


六、RAG 完整工作流

💬 生成阶段

🔍 在线检索阶段

📥 离线索引阶段

向量检索

注入 Context

原始文档

文本切片 Chunking

Embedding 向量化

向量数据库

用户问题

问题向量化

相似度检索 Top-K

相关文档片段

组装 Context
(问题 + 检索结果 + System Prompt)

LLM 推理生成

最终答案


七、MCP 协议架构

工具服务侧

标准协议层

Agent 侧

标准协议

统一接口

统一接口

统一接口

统一接口

MCP Client
(内嵌于 Agent)

MCP Protocol
JSON-RPC over
Stdio / SSE / HTTP

MCP Server
文件系统

MCP Server
Web 搜索

MCP Server
数据库

MCP Server
自定义 API

MCP 之于 AI 工具,就像 USB 协议之于外设:统一标准,即插即用。


八、Tool 调用机制

Tool/MCP Server Agent LLM Tool/MCP Server Agent LLM 输出 Function Call\n{name, arguments} 执行工具调用 返回结果 Observation 将 Observation 追加到 Context 继续推理或给出最终答案

九、Skill 封装结构

🎯 Skill(技能模块)

System Prompt
角色定义 + 任务描述

Tools
可用工具列表

Logic Flow
内部逻辑/步骤

Examples
Few-shot 示例

Context Rules
上下文管理策略


十、Harness Engineering 体系

Harness\nEngineering

Eval 评估

基准测试

人工标注

LLM-as-Judge

Guardrail 护栏

输入过滤

输出约束

安全边界

Observability 可观测性

Trace 追踪

Log 日志

Metrics 指标

Testing 测试

单元测试

集成测试

端到端测试

Reliability 可靠性

重试机制

降级策略

超时控制


十一、全局概念关系图

输入给

优化

管理整个

存在于

RAG 检索注入

结果注入

标准化

替代

驱动

驱动

使用

使用

使用

封装

保障

🧠 LLM
大语言模型

📋 Context Window
上下文窗口

✍️ Prompt Engineering

🔧 Context Engineering

⚡ 短期记忆
Context 内

🗄️ 长期记忆
RAG

🔨 Tool
工具调用

🔌 MCP
标准协议

💻 CLI
命令行替代

📊 Workflow
固定流程

🤖 AI Agent
自主决策

🎯 Skill
能力封装

🛡️ Harness Engineering
可靠性工程


十二、关键结论

概念 所属层 核心作用
LLM 模型层 语言理解与生成的核心引擎
Prompt Engineering 工程层 优化单次输入质量
Context Engineering 工程层 管理整个上下文窗口的内容
RAG 工程层 为模型提供长期/外部知识
Tool / MCP 工程层 扩展模型与外部世界的交互
AI Agent 工程/应用层 自主规划和执行复杂任务
Skill 工程/应用层 将特定能力模块化封装复用
Harness Engineering 工程层 让 Agent 系统从能用变为可靠

技术演进主线

Prompt → Prompt Engineering → Context Engineering → Harness Engineering
工具调用 → Function Calling → MCP(标准化协议)
单次对话 → Workflow(固定流程)→ Agent(动态决策)

整理时间:2026-06-07

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐