02_AI技术名词解释
AI 领域主流技术名词手册
每个名词一句通俗解释 + 一个示例,同类术语归在一起
学习路线
AI 愿景 → 提示与交互 → Agent 架构与协作 → 推理范式 → 知识增强 → 模型基础与优化 → 前沿应用
一、AI 愿景与目标
AGI(通用人工智能)
解释:像人一样什么都能学、什么都能干的 AI,而不是只会做一件事的专用 AI。
示例:AlphaGo 能赢围棋冠军但不会干别的——这是弱人工智能;AGI 是今天学围棋、明天学编程、后天学做菜,每样都能达到人类专家水平——目前尚未实现。
ASI(超级人工智能)
解释:智力全面超越全人类总和的 AI,在所有领域都比最聪明的人类还要聪明得多。
示例:AGI 是爱因斯坦级别的科学家;ASI 是一万个爱因斯坦同时合作,还能自我进化——这还属于科幻范畴。
AIGC(AI Generated Content)
解释:用 AI 自动生成文字、图片、音频、视频等内容的技术。
示例:雇 10 个设计师做 1000 张海报要 20 天花 10 万元;用 AIGC 几秒钟生成 1000 张不同风格的详情页,成本≈电费。
Vibe Coding(氛围编程)
解释:用自然语言描述想要什么功能,由 AI 生成代码,开发者只需审查和调整。
示例:你告诉 AI"帮我写个爬虫,爬取豆瓣电影 Top250,保存为 CSV",AI 直接生成完整代码;你说"只爬评分 8.0 以上的",AI 修改,你运行完成。
二、提示与交互
Prompt Engineering(提示词工程)
解释:通过巧妙设计提问方式,引导 AI 给出更好的回答。
示例:
- 差的提问:“帮我写周报”
- 好的提问:“我是后端开发,本周完成用户登录模块重构,JWT 替换 session,性能提升 30%。下周做支付接口。问题:第三方文档不全。300 字,专业但不刻板。”
Context Engineering(上下文工程)
解释:精心设计和管理喂给 AI 的上下文内容,让它在有限的"记忆窗口"里获得最有用的信息。
示例:对话长了 AI 会忘前面的内容——Context Engineering 就是自动把之前的长对话压缩成"摘要+关键决策"塞回上下文,让 AI 既不忘记重点,又不会被废话占满空间。
Harness Engineering(驾驭工程)
解释:设计标准化框架来管理 AI 的输入、输出、工具调用和错误处理,让 AI 行为可控可测。
示例:没有 Harness 的 AI 像脱缰野马,输出格式随意、可能死循环;加了 Harness 后,输入有校验模板、输出有格式约束、超时自动重试、失败自动降级——像给野马套上缰绳和跑道。
HITL(人在回路)
解释:AI 处理常规任务,遇到没把握的事就转交人工审核。
示例:用户说"我要退款"→AI 自动处理;用户说"你们这破东西我要报警!"→AI 检测到愤怒情绪,置信度低,自动转人工客服。
三、Agent 架构与协作
Agent(AI 智能体)
解释:能自主感知环境、规划行动并完成复杂任务的 AI 系统。
示例:你说"帮我规划一次日本旅行",Agent 自主查好机票、预定酒店、规划每日行程、收藏必吃餐厅,最后问你要不要确认。
Role-playing Agents(角色扮演智能体)
解释:给 AI 赋予特定身份和性格,让它在协作中以固定人设进行推理和决策。
示例:一个项目评审团队由三个 Agent 组成——"严苛的技术评审"专挑架构漏洞,"乐观的产品经理"关注用户体验,"谨慎的安全专家"审查数据风险——各自从角色立场出发辩论,最终产出更全面的方案。
Workflow(工作流)
解释:把多个任务按预定顺序编排好,像流水线一样自动执行。
示例:每天下午 3 点自动触发:打开常点店铺→招牌奶茶→三分糖→加波霸→默认地址付款,你只需要说"老规矩"。
Function Calling(函数调用)
解释:让 AI 能调用外部工具(查天气、操作数据库、订票等),从只会聊天变成能干活。
示例:普通 AI 回答"上个月销售额多少?“→"大概有增长?”;Function Calling AI 调用数据库查询→"上个月销售额 3,847,291 元,比上月增长 12.3%"。
Skill(技能)
解释:封装了多个工具或步骤的复合能力,比单一函数调用更强大。
示例:Function 是单一操作如"查询天气";Travel Planning Skill 是综合能力,自动调用天气查询 + 机票搜索 + 酒店推荐 + 行程规划,输入"我想去三亚玩 5 天"就输出完整方案。
MCP(Model Context Protocol)
解释:AI 界的 USB-C 接口,统一标准让 AI 可以即插即用各种数据源和工具。
示例:没有 MCP 之前,AI 连 Google Drive、Slack、GitHub 各要写一套接口;有了 MCP 后,每个服务出一个 MCP Server,AI 客户端支持一个协议就能连接所有。
A2A Protocol(Agent-to-Agent)
解释:不同 AI Agent 之间互相发现、沟通和协作的标准化协议。
示例:你对"总协调 Agent"说"公司 50 人年会,预算 20 万,去三亚",它通过 A2A 自动呼叫差旅 Agent 订票、策划 Agent 出方案、财务 Agent 做预算,最后汇总完整方案给你。
四、推理范式
Chain of Thought(思维链)
解释:让 AI 把思考过程一步步写出来,而不是直接蹦答案,提高复杂问题的准确率。
一个笼子里关着若干只鸡和兔子。从上面数,一共有 35 个头;从下面数,一共有 94 只脚。请问笼子里各有几只鸡和几只兔子?
示例:
Self-ask(自问式推理)
解释:让 AI 面对复杂问题时先自己向自己提问,拆解成子问题逐个解决,再汇总答案。
示例:
Plan-and-Execute(规划与执行)
解释:AI 先制定完整计划再分步执行,思考和行动分开,避免走一步看一步的盲目性。
示例:
ReAct(推理 + 行动
解释:AI 边思考边行动,做一步、看结果、再想下一步,推理和交互交替进行。
示例:
ToT(思维树)
解释:AI 同时生成多条思路分支,评估后选最优的继续扩展,走不通就换一条。
示例:
Reflexion(迭代优化)
解释:AI 执行任务后反思自己的错误,把经验记下来,下次做得更好。
示例:
五、知识增强
Embedding(嵌入)
解释:把文字、图片等内容变成一串数字,语义相近的内容变出来的数字也相近。
示例:"猫"和"狗"变成向量后距离很近,"猫"和"汽车"距离很远——就像给每个词发了 GPS 坐标,意思相近的住得近。
Vector Database(向量数据库)
解释:专门存储和查找高维向量的数据库,能按"语义相似度"找东西。
示例:传统搜索输入"红色连衣裙"只能找到标题含这几个字的商品;向量搜索上传一张街拍照片,就能找到"风格相似度 89%“的裙子,哪怕商品标题写的是"气质显瘦仙女裙”。
RAG(检索增强生成)
解释:给 AI 配上知识库,遇到不会的先查资料再回答,相当于开卷考试。
示例:没有 RAG 的 AI 回答"女朋友生日送什么?“→"送花吧”;有 RAG 的 AI 先检索她朋友圈和聊天记录→"她上个月收藏了三次的香水,预算 800-1200 元,建议入手 YSL 自由之水"。
Fine-tuning(微调)
解释:在通用大模型基础上用特定领域数据继续训练,让它从通才变成专家。
示例:通用大模型像外语六级的普通人,什么都能聊;医疗微调模型像干了十年的老医生,能看懂病历开药方。
六、模型基础与优化
NLP(自然语言处理)
解释:让计算机理解、生成和处理人类语言的技术。
示例:输入法猜你想打什么字、微信翻译英文、垃圾短信自动识别、Siri 听懂你说话——都是 NLP 在日常中的应用。
CV(计算机视觉)
解释:让计算机能"看懂"图像和视频的技术。
示例:手机相册自动分类"人物"“风景”“美食”、12306 验证码"请点击图中的火车"、特斯拉自动驾驶识别行人和车辆——都是 CV 的应用。
CNN(卷积神经网络)
解释:专门处理图像的神经网络,像层层过滤的筛子一样从线条到形状逐步识别物体。
示例:识别猫的流程:第一层检测线条和边缘→第二层发现圆形(脸)和三角形(耳朵)→第三层发现胡须→最终判断"这是猫,置信度 98%"。
RNN(循环神经网络)
解释:有记忆的神经网络,处理序列数据时能记住前面看过什么。
示例:看句子"今天天气真好,我想去…“——普通神经网络忘了前面说的啥;RNN 记住了"天气好”,所以推测后面是"去公园"或"去爬山"。
LSTM(长短期记忆)
解释:带笔记本的 RNN,重要的事记下来,不重要的擦掉,能记住长距离的关键信息。
示例:一篇长文章后问"小明早上第一件事做了什么?"——普通 RNN 忘了;LSTM 看到"买早餐"就记在笔记本上,后面翻笔记本直接回答。
Transformer
解释:一眼看完整个句子并自动划重点的架构,能直接建立远距离词之间的联系。
示例:句子"The animal didn’t cross the street because it was too tired"——Transformer 通过注意力权重直接判断出"it"指的是"animal",而不是"street"。
BERT
解释:同时从左到右和从右到左阅读的双向语言模型,像做"完形填空"一样理解上下文。
示例:句子"我把钱存进了___,因为要取利息"——单向模型只能根据前半句猜;BERT 结合后面"取利息"的信息,准确判断出是"银行"。
YOLO(实时目标检测)
解释:看一眼图片就一口气说出所有物体及其位置的快速检测算法。
示例:看图→"猫在左上角 95%,狗在右下角 92%,人在中间 98%"——一口气说完,快就完了。
MoE(专家混合)
解释:大模型里住很多小专家,来什么问题就派对应专家处理,不是所有人一起上。
示例:非 MoE 是不管什么病把全院 200 个医生都叫来会诊;MoE 是预检分诊一看"心脏问题→心内科 3 个专家",“皮肤问题→皮肤科 2 个专家”,精准高效。
RLHF(人类反馈强化学习)
解释:用人类打分来训练 AI,让它说话更符合人类偏好——有用、诚实、无害。
示例:没 RLHF 的 AI 回答"我是不是胖了?“→"确实比上个月重了 3 斤”;经过 RLHF 训练后→"哪有!你这是长对地方了,健康最重要"。
核心概念对比速查
| 对比项 | 说明 |
|---|---|
| AGI vs ASI | AGI = 人类水平全能 AI;ASI = 超越全人类总和的超级 AI |
| RAG vs Fine-tuning | RAG = 开卷考试(查资料答题);Fine-tuning = 闭卷学霸(知识内化) |
| Agent vs Workflow vs ReAct | Workflow = 菜谱(固定流程);ReAct = 大厨(边做边调整);Agent = 私人厨师(完全自主) |
| Function vs Skill vs MCP | Function = 单个工具;Skill = 工具箱;MCP = 工具箱接口标准 |
| MCP vs A2A | MCP = AI 的手脚(连数据源和工具);A2A = AI 的嘴(Agent 之间沟通协作) |
| 推理范式对比 | CoT = 一步步想;Self-ask = 自问自答;Plan-and-Execute = 先计划再干;ReAct = 边想边干;ToT = 多条路试;Reflexion = 干完反思再改进 |
| CNN vs RNN vs Transformer | CNN 看图(图像);RNN 读序列(有记忆);Transformer 一目十行(注意力机制) |
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)