02_AI技术名词解释

2501_91571672

347人浏览 · 2026-06-07 10:00:41

2501_91571672 · 2026-06-07 10:00:41 发布

AI 领域主流技术名词手册

每个名词一句通俗解释 + 一个示例，同类术语归在一起

学习路线

AI 愿景 → 提示与交互 → Agent 架构与协作 → 推理范式 → 知识增强 → 模型基础与优化 → 前沿应用

一、AI 愿景与目标

AGI（通用人工智能）

解释：像人一样什么都能学、什么都能干的 AI，而不是只会做一件事的专用 AI。

示例：AlphaGo 能赢围棋冠军但不会干别的——这是弱人工智能；AGI 是今天学围棋、明天学编程、后天学做菜，每样都能达到人类专家水平——目前尚未实现。

ASI（超级人工智能）

解释：智力全面超越全人类总和的 AI，在所有领域都比最聪明的人类还要聪明得多。

示例：AGI 是爱因斯坦级别的科学家；ASI 是一万个爱因斯坦同时合作，还能自我进化——这还属于科幻范畴。

AIGC（AI Generated Content）

解释：用 AI 自动生成文字、图片、音频、视频等内容的技术。

示例：雇 10 个设计师做 1000 张海报要 20 天花 10 万元；用 AIGC 几秒钟生成 1000 张不同风格的详情页，成本≈电费。

Vibe Coding（氛围编程）

解释：用自然语言描述想要什么功能，由 AI 生成代码，开发者只需审查和调整。

示例：你告诉 AI"帮我写个爬虫，爬取豆瓣电影 Top250，保存为 CSV"，AI 直接生成完整代码；你说"只爬评分 8.0 以上的"，AI 修改，你运行完成。

二、提示与交互

Prompt Engineering（提示词工程）

解释：通过巧妙设计提问方式，引导 AI 给出更好的回答。

示例：

差的提问：“帮我写周报”
好的提问：“我是后端开发，本周完成用户登录模块重构，JWT 替换 session，性能提升 30%。下周做支付接口。问题：第三方文档不全。300 字，专业但不刻板。”

Context Engineering（上下文工程）

解释：精心设计和管理喂给 AI 的上下文内容，让它在有限的"记忆窗口"里获得最有用的信息。

示例：对话长了 AI 会忘前面的内容——Context Engineering 就是自动把之前的长对话压缩成"摘要+关键决策"塞回上下文，让 AI 既不忘记重点，又不会被废话占满空间。

Harness Engineering（驾驭工程）

解释：设计标准化框架来管理 AI 的输入、输出、工具调用和错误处理，让 AI 行为可控可测。

示例：没有 Harness 的 AI 像脱缰野马，输出格式随意、可能死循环；加了 Harness 后，输入有校验模板、输出有格式约束、超时自动重试、失败自动降级——像给野马套上缰绳和跑道。

HITL（人在回路）

解释：AI 处理常规任务，遇到没把握的事就转交人工审核。

示例：用户说"我要退款"→AI 自动处理；用户说"你们这破东西我要报警！"→AI 检测到愤怒情绪，置信度低，自动转人工客服。

三、Agent 架构与协作

Agent（AI 智能体）

解释：能自主感知环境、规划行动并完成复杂任务的 AI 系统。

示例：你说"帮我规划一次日本旅行"，Agent 自主查好机票、预定酒店、规划每日行程、收藏必吃餐厅，最后问你要不要确认。

Role-playing Agents（角色扮演智能体）

解释：给 AI 赋予特定身份和性格，让它在协作中以固定人设进行推理和决策。

示例：一个项目评审团队由三个 Agent 组成——"严苛的技术评审"专挑架构漏洞，"乐观的产品经理"关注用户体验，"谨慎的安全专家"审查数据风险——各自从角色立场出发辩论，最终产出更全面的方案。

Workflow（工作流）

解释：把多个任务按预定顺序编排好，像流水线一样自动执行。

示例：每天下午 3 点自动触发：打开常点店铺→招牌奶茶→三分糖→加波霸→默认地址付款，你只需要说"老规矩"。

Function Calling（函数调用）

解释：让 AI 能调用外部工具（查天气、操作数据库、订票等），从只会聊天变成能干活。

示例：普通 AI 回答"上个月销售额多少？“→"大概有增长？”；Function Calling AI 调用数据库查询→"上个月销售额 3,847,291 元，比上月增长 12.3%"。

Skill（技能）

解释：封装了多个工具或步骤的复合能力，比单一函数调用更强大。

示例：Function 是单一操作如"查询天气"；Travel Planning Skill 是综合能力，自动调用天气查询 + 机票搜索 + 酒店推荐 + 行程规划，输入"我想去三亚玩 5 天"就输出完整方案。

MCP（Model Context Protocol）

解释：AI 界的 USB-C 接口，统一标准让 AI 可以即插即用各种数据源和工具。

示例：没有 MCP 之前，AI 连 Google Drive、Slack、GitHub 各要写一套接口；有了 MCP 后，每个服务出一个 MCP Server，AI 客户端支持一个协议就能连接所有。

A2A Protocol（Agent-to-Agent）

解释：不同 AI Agent 之间互相发现、沟通和协作的标准化协议。

示例：你对"总协调 Agent"说"公司 50 人年会，预算 20 万，去三亚"，它通过 A2A 自动呼叫差旅 Agent 订票、策划 Agent 出方案、财务 Agent 做预算，最后汇总完整方案给你。

四、推理范式

Chain of Thought（思维链）

解释：让 AI 把思考过程一步步写出来，而不是直接蹦答案，提高复杂问题的准确率。

一个笼子里关着若干只鸡和兔子。从上面数，一共有 35 个头；从下面数，一共有 94 只脚。请问笼子里各有几只鸡和几只兔子？

示例：
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

Self-ask（自问式推理）

解释：让 AI 面对复杂问题时先自己向自己提问，拆解成子问题逐个解决，再汇总答案。

示例：

Plan-and-Execute（规划与执行）

解释：AI 先制定完整计划再分步执行，思考和行动分开，避免走一步看一步的盲目性。

示例：
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

ReAct（推理 + 行动

解释：AI 边思考边行动，做一步、看结果、再想下一步，推理和交互交替进行。

示例：

ToT（思维树）

解释：AI 同时生成多条思路分支，评估后选最优的继续扩展，走不通就换一条。

示例：

Reflexion（迭代优化）

解释：AI 执行任务后反思自己的错误，把经验记下来，下次做得更好。

示例：

五、知识增强

Embedding（嵌入）

解释：把文字、图片等内容变成一串数字，语义相近的内容变出来的数字也相近。

示例："猫"和"狗"变成向量后距离很近，"猫"和"汽车"距离很远——就像给每个词发了 GPS 坐标，意思相近的住得近。

Vector Database（向量数据库）

解释：专门存储和查找高维向量的数据库，能按"语义相似度"找东西。

示例：传统搜索输入"红色连衣裙"只能找到标题含这几个字的商品；向量搜索上传一张街拍照片，就能找到"风格相似度 89%“的裙子，哪怕商品标题写的是"气质显瘦仙女裙”。

RAG（检索增强生成）

解释：给 AI 配上知识库，遇到不会的先查资料再回答，相当于开卷考试。

示例：没有 RAG 的 AI 回答"女朋友生日送什么？“→"送花吧”；有 RAG 的 AI 先检索她朋友圈和聊天记录→"她上个月收藏了三次的香水，预算 800-1200 元，建议入手 YSL 自由之水"。

Fine-tuning（微调）

解释：在通用大模型基础上用特定领域数据继续训练，让它从通才变成专家。

示例：通用大模型像外语六级的普通人，什么都能聊；医疗微调模型像干了十年的老医生，能看懂病历开药方。

六、模型基础与优化

NLP（自然语言处理）

解释：让计算机理解、生成和处理人类语言的技术。

示例：输入法猜你想打什么字、微信翻译英文、垃圾短信自动识别、Siri 听懂你说话——都是 NLP 在日常中的应用。

CV（计算机视觉）

解释：让计算机能"看懂"图像和视频的技术。

示例：手机相册自动分类"人物"“风景”“美食”、12306 验证码"请点击图中的火车"、特斯拉自动驾驶识别行人和车辆——都是 CV 的应用。

CNN（卷积神经网络）

解释：专门处理图像的神经网络，像层层过滤的筛子一样从线条到形状逐步识别物体。

示例：识别猫的流程：第一层检测线条和边缘→第二层发现圆形（脸）和三角形（耳朵）→第三层发现胡须→最终判断"这是猫，置信度 98%"。

RNN（循环神经网络）

解释：有记忆的神经网络，处理序列数据时能记住前面看过什么。

示例：看句子"今天天气真好，我想去…“——普通神经网络忘了前面说的啥；RNN 记住了"天气好”，所以推测后面是"去公园"或"去爬山"。

LSTM（长短期记忆）

解释：带笔记本的 RNN，重要的事记下来，不重要的擦掉，能记住长距离的关键信息。

示例：一篇长文章后问"小明早上第一件事做了什么？"——普通 RNN 忘了；LSTM 看到"买早餐"就记在笔记本上，后面翻笔记本直接回答。

Transformer

解释：一眼看完整个句子并自动划重点的架构，能直接建立远距离词之间的联系。

示例：句子"The animal didn’t cross the street because it was too tired"——Transformer 通过注意力权重直接判断出"it"指的是"animal"，而不是"street"。

BERT

解释：同时从左到右和从右到左阅读的双向语言模型，像做"完形填空"一样理解上下文。

示例：句子"我把钱存进了___，因为要取利息"——单向模型只能根据前半句猜；BERT 结合后面"取利息"的信息，准确判断出是"银行"。

YOLO（实时目标检测）

解释：看一眼图片就一口气说出所有物体及其位置的快速检测算法。

示例：看图→"猫在左上角 95%，狗在右下角 92%，人在中间 98%"——一口气说完，快就完了。

MoE（专家混合）

解释：大模型里住很多小专家，来什么问题就派对应专家处理，不是所有人一起上。

示例：非 MoE 是不管什么病把全院 200 个医生都叫来会诊；MoE 是预检分诊一看"心脏问题→心内科 3 个专家"，“皮肤问题→皮肤科 2 个专家”，精准高效。

RLHF（人类反馈强化学习）

解释：用人类打分来训练 AI，让它说话更符合人类偏好——有用、诚实、无害。

示例：没 RLHF 的 AI 回答"我是不是胖了？“→"确实比上个月重了 3 斤”；经过 RLHF 训练后→"哪有！你这是长对地方了，健康最重要"。

核心概念对比速查

对比项	说明
AGI vs ASI	AGI = 人类水平全能 AI；ASI = 超越全人类总和的超级 AI
RAG vs Fine-tuning	RAG = 开卷考试（查资料答题）；Fine-tuning = 闭卷学霸（知识内化）
Agent vs Workflow vs ReAct	Workflow = 菜谱（固定流程）；ReAct = 大厨（边做边调整）；Agent = 私人厨师（完全自主）
Function vs Skill vs MCP	Function = 单个工具；Skill = 工具箱；MCP = 工具箱接口标准
MCP vs A2A	MCP = AI 的手脚（连数据源和工具）；A2A = AI 的嘴（Agent 之间沟通协作）
推理范式对比	CoT = 一步步想；Self-ask = 自问自答；Plan-and-Execute = 先计划再干；ReAct = 边想边干；ToT = 多条路试；Reflexion = 干完反思再改进
CNN vs RNN vs Transformer	CNN 看图（图像）；RNN 读序列（有记忆）；Transformer 一目十行（注意力机制）