目录

前言

一、应用层・日常可直接接触的 AI 相关概念

1.1 AI 应用

1.2 AIGC (Artificial Intelligence Generated Content)

1.3 ToB 与 ToC

1.4 API

1.5 Token (词元)

1.6 AI Native (AI 原生)

1.7 RAG (检索增强生成)

1.8 Workflow(工作流)

1.9 AI Agent (AI 智能体)

1.10 Vibe Coding(氛围编程)

1.11 Prompt Engineering (提示词工程)

1.12 多模态

1.13 具身智能

1.14 垂直场景

二、模型层・AI 核心大脑相关概念

2.1 基座模型

2.2 训练

2.3 推理

2.4 参数

2.5 Token 上下文

2.6 微调

2.7 蒸馏(AI 模型蒸馏)

2.8 数据标注

2.9 开源与闭源

2.10 AI 幻觉

2.11 AI Skills

2.12 Embedding (嵌入向量)

三、基础设施层・AI 运行底层地基

3.1 Infra (Infrastructure: 基础设施层)

3.2 云服务

3.3 数据中心

3.4 算力集群

四、芯片层・AI 动力核心硬件

4.1 芯片概述

4.2 GPU (图形处理器)

4.3 算力

4.4 芯片

4.5 CUDA (并行计算架构)

4.6 芯片出口管制

五、能源层・AI 产业最底层保障

5.1 算力成本

5.2 电力消耗

5.3 清洁能源与核电

六、MCP(Model Context Protocol,模型上下文协议)

写在最后


前言

        你是否经常听见这些关于 AI 的词汇, 那么这些词到底是什么意思,听着一个个都高大上,深不可测,又极度抽象,今天这篇文章就给大家通俗易懂的讲一下,当然这只是我个人理解,如有错误还请大佬能够指正。

        要了解这些词,首先得了解一下 AI 是什么, 黄仁勋说过, AI 是一个五层大蛋糕,这个比喻非常的形象,这五层是什么?

自下而上分别是

  1. 能源层 Energy
  2. 芯片层 Chips
  3. 基础设施层 Infrastructure
  4. 模型层 Models
  5. 应用层 Applications

一、应用层・日常可直接接触的 AI 相关概念

1.1 AI 应用

        我们先从离我们大家最近的应用层开始说起,应用层就是我们每天能用到的,接触到的这些解决你具体问题的这些产品,比如说国外的 Chat GPT、Claude,国内的豆包、 Deep Seek 等等,除了这些软件,还有硬件比如 AI 机器人、AI 眼镜等。就是把 AI 的能力包装成了产品,能够直接帮你解决你提出的问题,比如我们与 DeepSeek 对话,你提问,他回答,这就是你在使用一个 AI 的应用。

1.2 AIGC (Artificial Intelligence Generated Content)

        AI 生成的内容,比如 ai 生成的文字小说、图片、视频、音乐、代码等等。

1.3 ToB 与 ToC

        ToC 与 ToB 不是一个新的概念在各行各业都存在,简单来讲 ToC:To Consumer → 面向个人用户、ToB:To Business → 面向企业商家 在 AI 领域也是类似,ToB:将 AI 应用卖给企业,ToC: 将 AI 应用卖给个人,比如最近豆包推出了付费版本。

举一些例子:

  • ToC 场景 聊天 AI:豆包、Chat GPT、文心一言个人版 影音 AI:AI 配音、AI 换脸、短视频 AI 剪辑

  • ToB 场景 电商 AI:商家 AI 自动写标题、AI 客服、AI 选品 医疗 AI:医院影像诊断、药企 AI 研发 办公 AI:企业智能审批、AI 财务对账、OA 智能助手

1.4 API

        模型对外开放的接口或 “插座”,开发者们可以将自己的产品插进来,然后获得 AI 的能力。

1.5 Token (词元)

        Token 就是 AI 拆分出来的最小文字碎片,是 AI 处理文本的最小单位,也是大模型 API 按量计费的核心计价单位,中文正式叫法为词元。 中文语境下,大致 1 个汉字约等于 1~2 个 Token;通常基座模型能力越强,调用对应的 Token 计费单价越高。 调用大模型 API 产生的 Token 消耗数量,统称为用量。 它和互联网行业常用的 DAU(日活跃用户数)、电商行业的 GMV(商品交易总额) 一样,都是行业通用核心业务统计指标。

举个例子

今天天气真好,拆成 Token: 今、天、天、气、真、好 一共 6 个 Token

I love AI 拆成 Token: I、love、AI 一共 3 个 Token

        以上举例并不严谨,只是简单举例,AI 世界中文字、图片、视频等等最终都会被计量成统一的单位 Token。

1.6 AI Native (AI 原生)

        从一开始设计开发的基座就是 AI, 一切以 AI 为中心,架构、数据、交互、决策全围绕模型设计,骨子里就是 Ai 的产品,不是给已经存在的软件打补丁,做辅助功能,而是从头就是用 AI 逻辑设计的,逻辑靠大模型推理,不是写死的 If-Else,数据不是用来作为统计报表,是用来喂模型、持续迭代。比如豆包、DeepSeek,ChatGPT,这些是有了 AI 后才出现的 AI  软件,而不是先存在了这些软件后接入了 AI 。

        AI Native(AI 原生)是一种产品与商业范式:从设计之初就以大模型为核心引擎,而非后期附加功能;系统的核心价值、决策逻辑与用户体验全部由 AI 驱动,并通过数据持续自迭代。

1.7 RAG (检索增强生成)

        RAG 全称:检索增强生成 以往大模型只会依靠自身训练好的固有知识作答,不仅知识存在时间滞后性,还容易凭空编造内容、出现 AI 幻觉,给出错误答案。 而 RAG 技术会先在专属数据库、实时资讯、行业资料里检索匹配相关内容,把精准真实的信息调取出来,再交给大模型整合梳理、组织语言输出答案。

        它最大优势就是补齐知识盲区、杜绝胡乱编造、支持专属定制内容问答。企业搭建专属知识库、行业答疑、实时资讯问答、本地资料问答都离不开 RAG,也是目前落地商用最主流、性价比最高的 AI 应用技术。

        举个例子 公司把内部规章制度、产品手册全部存入专属知识库,员工提问相关工作问题时,AI 不会凭固有知识乱答,而是先用 RAG 检索调取公司内部文件内容,再整理出精准合规的回答,这就是典型的 RAG 落地应用。

        简单来说:就是让 AI 先上网查资料、调取专属知识库,再结合查到的真实信息来回答问题。

1.8 Workflow(工作流)

        就和人处理事务一样,做事要理清先后顺序,分清先后步骤循序渐进完成。AI 起初无法自主梳理复杂事务的执行顺序,我们提前规划好完整执行步骤交给 AI,让 AI 严格依照既定顺序自动完成整套任务,这就是 AI 工作流。

        通俗解释:提前编排好整套任务的执行顺序,明确先后操作顺序,一键启动即可全自动完成全部流程,无需人工一步步手动操作执行。

举个例子:

  • 办公流程:自动抓取日报数据→汇总整理→生成周报→定时发送到工作群
  • 文案流程:关键词输入→AI 写初稿→自动润色排版→一键导出文档
  • 客服流程:用户提问→RAG 检索资料→调用专业技能作答→自动分类归档聊天记录
  • 数据流程:采集表格数据→智能核对纠错→生成统计图表→保存归档

常见的工作流平台

  • Coze 扣子:国内主流,简单易上手,人人都能搭建 AI 工作流
  • Dify:主打企业级智能流程搭建,适配知识库与业务场景
  • 飞书流程 / 钉钉自动化:企业内部办公专属工作流平台

1.9 AI Agent (AI 智能体)

        我们知道传统的 AI 大都是一问一答,而 AI Agent 则升级进化了,举个例子更加简单明了:

比如:安排周末出游

  • 传统普通 AI 你:帮我规划周末去青岛玩 AI:给你一段游玩攻略文案

  • AI Agent 智能体 你:帮我安排周末青岛两日游 Agent 自动一步步完成: 查询近期天气 筛选性价比高铁票 挑选就近酒店 制定每日行程路线 整理美食清单 汇总成完整出行方案

        与只能对话的 AI 不同,Agent 能完成实际任务,如整理文件夹、下载图片、订机票等,可减轻人类琐碎工作,如果说传统 AI 是嘴巴的话,那 Agent 就是手脚,能帮你把事情拆解,调用工具,按步骤执行任务。

1.10 Vibe Coding(氛围编程)

        AI 出现以后,经常听见 Vibe Coding,那这是什么? 所谓 Vibe Coding,是由 Open AI 联合创始人 Andrej Karpathy 在 2025 年 2 月提出,是 AI 驱动的新型编程范式,核心是用自然语言说想法、AI 生成代码、人类只管效果与方向,不用逐行手写和调试。

        其核心是你不用懂编程语言的语法:用日常语言描述 “要什么效果”,而非 “怎么写代码”。可以快速迭代:“说需求→生成代码→运行看结果→反馈调整” 的短循环。不深度审查底层代码,专注功能与体验。

        普通 AI 辅助编程的区别,普通 AI 辅助是人主导,逐行审查、理解、修改代码。而 Vibe Coding 是由 AI 主导执行,人是产品 / 体验负责人,只提需求、看效果。

举例

  • 快速原型:一句话生成 Vue3 商品管理页(含表格、搜索、分页、弹窗),半小时上线。
  • 工具自建:自媒体用它做热点匹配工具、个人做语音记账本、宝宝成长记录小程序。
  • 业务系统:生成购物车总价计算(含折扣运费)、企业内部 CRUD 管理模块。

        Vibe Coding,让零基础不懂编程的人,也能轻松搭建程序、搭建工具,快速感受开发创作的乐趣,大幅降低开发门槛,整体开发效率大幅提升。

        对于专业程序员而言,它能够替代重复繁琐的编码工作,简化开发流程,有效提升日常工作效率。但与此同时,这种极简高效的开发模式,也对传统基础编程岗位形成冲击,正在改变行业用工需求与职业发展格局。

1.11 Prompt Engineering (提示词工程)

        在与豆包或 DeepSeek 对话时,你说的每一句话就是一句提示词,你会发现有时候你描述的详细,有条理,AI 回答的就会更准确,你描述的模糊,AI 回答的就比较空泛。那么提示词工程就是专门研究怎么说话、怎么下命令,学会与 AI 说话,让 AI 精准听懂你的想法,稳稳输出你想要的结果,不靠瞎猜、不靠运气,是一套说话技巧。简单说来:不是随便打字,是有方法地给 AI 提要求,那么同样的问题,问法不同,答案天差地别

举个例子 写朋友圈文案

  • 随便说:帮我写文案
  • 用技巧说:你是文艺博主,写简短治愈风朋友圈文案,适合下班发,字数 20 字以内

1.12 多模态

        通常来讲,AI 在最开始只能对话,和写文字,随着发展,现在好多 AI 能同时处理文字、图片、声音、视频等多种模式和形态,这就是 多模态 AI。比如使用豆包、GPT 处理可以对话外,你也可以与其视频对话,发送文档或者图片让他们帮你解析,这都属于多模态 AI 的应用场景。

1.13 具身智能

        除了存在手机电脑里,只会想、只会说,没有身体,碰不到实物的 AI 软件外,还存在 AI 硬件,AI 不光会动脑思考,还拥有实体身体,能在现实世界里亲眼看见、亲手触摸、自主走动、实操干活,靠身体感知环境、适应环境、自主完成任务。

举个例子:

  • 家用扫地机器人:自己看房里布局,绕开桌椅拖鞋,自动扫拖,迷路自己找路,典型具身智能
  • 餐厅送餐机器人:自己坐电梯、避行人、精准送到餐桌,完成送餐、回餐工作。
  • 自动驾驶:车子靠摄像头、雷达、传感器,眼睛看路、耳朵测距,再用 AI 大脑判断: 该走、该停、该超车、该避让行人、变道、转弯全都自己搞定。是 AI 在现实世界中最复杂的应用之一,是从辅助人,到替代人完成一系列复杂任务的最前沿。

1.14 垂直场景

        不做通用全能 AI,而是专门深耕某一个细分行业、特定用途,针对性优化功能,在这个领域里做得更专业、更好用。

        通用 AI:啥都能干,聊天、写文、画图、答疑都行,但样样都不精 垂直场景 AI:只聚焦一个领域,功能精准贴合行业需求,专业性更强

比如服务于具体细分场景的 AI,如金融、教育等领域的应用。

  • 医疗垂直 AI:影像筛查、病历整理、辅助诊断、用药建议
  • 图像垂直场景:专业生图 AI,主打精准出图、行业风格定制,专攻作图领域如 gpt images 2
  • 视频垂直场景:Seedance 这类专业 AI 视频工具,只专注视频生成、剪辑、特效制作

二、模型层・AI 核心大脑相关概念

2.1 基座模型

        基座模型:刚出生、天赋拉满的天才婴儿大脑,最底层的模型 。

        大模型:所有 AI 智能大脑的统称 基座模型、微调后的行业模型、聊天模型,全都叫大模型。

        大模型是人工智能的核心智慧中枢,就是 AI 的大脑,由海量数据训练而成,具备通用理解与内容生成能力。基座大模型是底层原生基础模型,市面上多数微调模型与行业衍生模型,均依托基座模型迭代优化而来,手握顶尖基座模型,便能占据 AI 产业链的核心优势地位。

目前全球顶尖的基座大模型有

国外:

  • Open AI 的 GPT-5.5/GPT-4o(美国),
  • Anthropic Claude Opus 4.7(美国),
  • Google Gemini Ultra 3(美国),
  • xAI Grok 4(美国,马斯克)

国内:

  • 深度求索 Deep Seek V4 / Deep Seek-R1、
  • 阿里 通义千问 Qwen3.5 / Qwen3-Max、
  • 字节 豆包(Seed 2.0 Pro)、
  • 月之暗面 Kimi 2.6、
  • 小米 MiMo‑V2‑Pro

2.2 训练

        让 AI 从一无所知到无所不知的过程,把海量的文本、图片、代码喂给模型,在反复的训练中学会理解和生成,就像教孩子读书成才 孩子从零不懂事,海量书本知识反复学,慢慢学会认字、理解逻辑、说话做事,这个学习全过程,就是模型训练。

2.3 推理

        如果说训练是 AI 上学读书,推理就是 AI 平时动脑做题、回答问题,你输入一句话、一个问题、一个指令,AI 当场调动脑子,顺着逻辑一步步思考,给出答案、生成内容,这个实时思考输出的过程,就叫模型推理。

        模型预训练阶段是整个 AI 产业最烧钱的环节,依靠海量优质数据完成学习迭代,全程需要高端 AI 芯片、大规模集群算力、充足电力以及顶尖技术团队等多重高成本资源支撑。

         而模型推理是商业化落地后长期持续产生开销的核心环节,也是决定企业能否摊薄前期投入、实现整体盈利的重要一环。前期训练已经投入巨额固定成本,后期只有控制好推理成本、扩大营收规模,才能逐步回本实现盈利。

        DeepSeek 凭借技术优化大幅压低了推理运行成本,在行业内形成极强成本优势,再加上本身模型性能出色、开源易用等优势,成本下降直接拉高利润空间,这也是它快速崛起、一鸣惊人的核心原因之一。

2.4 参数

        刚刚已经知道模型是 AI 的大脑,那么参数 = AI 大脑里的神经连接数量 类比人脑:参数越多,脑细胞和思维通路越多,脑子越灵活、记性越好、逻辑越强、懂的东西越杂。

        参数数量是衡量 AI 模型大小的指标,参数越多,模型越大。衡量模型体量的数字,可以粗略理解为模型存储知识和规律的格子,类似于像素,参数越多不等于一定更聪明。

我们常说的多少 B 的模型,B (B = Billion = 十亿),AI 里说的 1B = 10 亿参数

  • 小参数模型(1B 以内) 规模:几十亿以内 特点:轻巧、速度快、耗电低、本地手机就能跑,只能做简单对话、短句问答 例子:轻量闲聊模型、手机端极简 AI、智能音箱内置小模型。

  • 中小参数(1B~7B) 特点:日常聊天、写短句、简单文案够用,性价比极高,推理成本极低 代表:Deep Seek-7B、通义千问 7B、Llama3-7B 用途:普通客服、日常问答、轻度办公。

  • 中等参数(13B~34B) 特点:能力均衡,能写文章、做基础数据分析、简单代码,商用最主流 代表:Llama3-34B、智谱 GLM-13B 用途:中小企业办公 AI、垂直行业轻量化应用。

  • 大参数(65B~100B) 特点:深度思考、长文案、专业写作、复杂逻辑都很强,接近顶尖水平 代表:早期主流基座模型,国内多数通用大模型主力版本。

  • 超大参数(100B 以上 千亿级) 特点:全能型大脑,多模态、超强推理、超长上下文、科研级能力拉满 代表:GPT-4 千亿级参数、小米 MiMo V2 Pro(MoE 架构,总参数超万亿,激活 420 亿)、通义千问 Max、Claude、Gemini Ultra 用途:顶级研发、复杂 Agent 任务、专业科研、企业顶级服务。

        参数不是越大越强 但在同等技术下参数肯定是越大越强; 技术优化好,小参数也能打赢老款大参数(比如 Deep Seek 7B 胜过很多老牌 30B 模型)。

2.5 Token 上下文

        常说的百万级上下文,指的是 1M 上下文 = 100 万 Token,不要与上面的参数搞混了,不要看着说 1M 很小,实际上在 AI 领域百万级(1M token)上下文,技术上很难、工程上昂贵,实现百万级上下文难度极大,不仅会让算力运算量暴涨、大幅占用显存资源,拉高训练与推理成本,还容易出现中间内容遗忘、重点信息抓取不准的问题,同时还要优化位置编码与模型底层架构,搭配专属技术方案才能稳定使用,目前仅有少数顶尖大模型做到原生支持。

        举例: Kimi、Claude 上下文:100 万 Token(百万级记性) 意思:一次性读完几十本书、长篇合同、整本论文不忘记 1M 上下文 = 能一次性吃下 70 万字内容,1M 上下文能一次性读完 7 本长篇书籍。

2.6 微调

        在现成厉害的基座大模型基础上,不用从头重练,只用少量专属数据,对 AI 进行 “补课”,小幅度改一改,把通用 AI 练成行业专用 AI,如果说基座模型 = 全能学霸,啥都懂,那么微调 = 针对性补课,专攻某一门专业课,快速变成领域专家。

2.7 蒸馏(AI 模型蒸馏)

        把超大体积、超强能力的大模型学到的知识、逻辑与表达能力,提炼压缩迁移到小型模型中,在尽量保留核心能力的同时,精简参数、降低算力与显存占用。

        千亿参数顶尖大老师学识渊博但体型庞大、耗能极高,没法随身使用;通过蒸馏技术,把老师所有答题思路、知识要点提炼出来,教给小型学生模型,学生体型小巧耗电少,日常答题水准接近大老师,能直接装在本地设备、普通服务器上流畅运行。

        国内知名大模型 DeepSeek 就大规模运用模型蒸馏技术,依托自身万亿级超大规模基座大模型作为母体,不断蒸馏衍生出多款不同规格的轻量化子模型,兼顾高性能与低功耗,快速适配多元化落地场景。

举例

  • DeepSeek 系列:依托超大型基座模型持续蒸馏,推出多款轻量版 DeepSeek 小模型,兼顾推理速度与回答质量,广泛用于办公、文案、智能客服等场景。
  • 通义千问轻量版:阿里通义千亿大模型通过知识蒸馏,压缩出中小参数模型,适配手机端、智能家居等低算力设备运行。
  • 讯飞星火轻量化模型:依托主干大模型完成蒸馏压缩,大幅降低使用门槛,普及至教育、车载智能交互等大众场景。

2.8 数据标注

        在 AI 变聪明之前,需要大量的真人来教他什么是对的,告诉他这张图是猫,这段代码是对的,没有数据标注,模型就无法对齐人类的价值判断,给原始杂乱数据打标签、做分类、标答案,把普通素材变成 AI 能看懂、能用来学习的标准教材,数据标注就是人工给数据做标准答案,是训练 AI 最基础、最前置的必备工作。

        数据标注是 AI 训练与微调最核心、最刚需的前置基础,没有标注好的规范数据,大模型就没有标准学习素材,没法精准学会任务、也做不好行业微调,堪称 AI 产业的地基。

其实平时我们也或多或少做过标注,比如登录时,验证码选择图中包含斑马线的图片等。

举例

  • 图像标注:在图片上圈出物体、分类 例:马路图片圈出行人、车辆、红绿灯;医疗影像标出病灶位置,训练自动驾驶、医疗 AI。
  • 语音标注:语音转文字 + 标注情绪 / 场景 例:把方言语音转成文字,标注语气情绪,训练语音助手,如豆包可以与你进行方言对话。

2.9 开源与闭源

        与传统软件的开源与闭源不同,传统软件开源:开放程序代码,改的是功能界面、逻辑流程。

        AI 大模型开源:开放模型权重(大脑参数),改的是 AI 智商、知识、思维逻辑,传统闭源软件:买软件使用权,AI 闭源大模型:买调用次数 / 算力推理服务,不卖模型本身,如 GPT-4、GPT-4o、谷歌 Gemini、豆包等.

        简单打比方就是 闭源大模型是可口可乐、肯德基脆皮鸡的配方,使用需要付费调用 API,开源大模型是菜谱大公开,任何可以自己下载并部署。如 DeepSeek 、阿里通义千问 Qwen 等。

2.10 AI 幻觉

        AI 幻觉 = 大模型一本正经胡说八道,自己编造不存在的事实、数据、人名、事件,语气还特别笃定。 由于 AI 的工作原理是预测下一个字或词是什么,而不是查阅事实真相,模型只靠语言逻辑拼接文字,没有真实记忆与现实认知 当知识库有空白、老旧、缺失内容,缺信息就自动脑补填补,长文本对话、专业冷门领域更容易乱编,而且参数偏小、训练数据不足,幻觉概率更高。

        有哪些常见的幻觉?

        如:捏造不存在书籍 / 论文、编造历史事件、捏造法律条文等

        总之,AI 没有真正见过世界,只会顺着文字语感造句,无法自主辨别内容真伪,信息不足时便随意编造内容,这种一本正经的虚假答案,就叫 AI 幻觉。不过随着技术的迭代更新,或是给模型接入实时互联网检索能力,都能有效大幅降低幻觉出现的概率。

2.11 AI Skills

        通用大模型知识面广、涉猎宽泛,日常闲聊问答都能应对,但各项能力不够专精,面对细分行业与固定工作场景时,执行效率偏低、精准度不足,还容易出现答非所问的情况。

        为了让 AI 精准适配各类实际业务,高效完成特定工作,通过定向专项训练打磨出各类专项能力,AI Skills 就此应运而生,推动 AI 从泛化闲聊转变为专精实干。

        Skills 也就是模型技能,是模型自身通过训练习得的专属本领,熟练掌握各类固定操作与业务流程,属于 AI 原生自带的执行能力,归属于大模型层。与之前应用层的 RAG 不同,RAG 属于外置辅助工具,不会改变模型本身的核心能力,仅负责调取外部真实资料辅助作答,归属于应用落地层。

        简单区分:Skills 是让 AI 会干活、熟流程,深耕专项业务,大幅提升实操熟练度;RAG 是让 AI 知新知、晓实情,补齐实时资讯与私有内部资料,有效规避 AI 幻觉问题。

举例

  • AI Skills:AI 经过专项训练掌握撰写周报、编写程序代码、表格排版整理等能力,无需调取外部资料,就能独立熟练完成对应工作。
  • RAG:将企业内部管理制度、新产品介绍、新产品介绍、行业专属资料录入知识库,用户咨询相关内容时,AI 先检索调取对应文件内容,再整合梳理给出答案,依靠外部资料完成应答。

        二者能够灵活搭配使用,先用 RAG 检索获取精准外部信息,再借助 AI Skills 规整格式、梳理逻辑,输出标准规范的最终答案。

2.12 Embedding (嵌入向量)

        它是将文字、图片、语音等人类可读懂的信息,统一转化为 AI 可识别的数字数组,方便人工智能完成内容比对、智能检索与语义判断。核心原理十分简单,含义相近的内容,转化后的数字向量距离更近;内容含义差距越大,向量距离也就越远。

        举例 输入两句意思相同的文案,生成的嵌入向量高度相似,AI 可快速识别内容重复;搭建 RAG 知识库时,先把各类文档转为嵌入向量,用户提问同步转为向量,快速匹配最贴合的相关资料;日常商品文案整理、用户评论分类、个性化内容推荐,都依靠嵌入向量实现。

三、基础设施层・AI 运行底层地基

3.1 Infra (Infrastructure: 基础设施层)

        基础设施层,就是支撑整个 AI 行业运转的底层硬件、GPU 芯片、服务器、算力集群、机房、云服务、存储、网络、电力、算力调度全都算 Infra 是 AI 所有业务最底层的 “地基”,没有这一层,大模型、应用全都跑不起来。

3.2 云服务

        AI 界的水电煤,云服务就是把机房、服务器、芯片、算力打包对外出租,专门给大模型做训练、推理、数据存储,属于底层硬件算力配套,如阿里云、腾讯云、AWS、Azure 等云服务,可提供算力和计算空间,用户无需自行购买服务器和芯片,按需调用即可。

3.3 数据中心

        一栋栋厂房大小的建筑,24 小时不断电,不断网,持续降温散热,集中存放大量服务器、AI 算力设备,统一供电、散热、联网、运维的大型专业机房,是 AI Infra(基础设施层)核心载体。核心组成:服务器集群、AI 算力机柜、供电系统、制冷散热、高速网络、存储设备、安防运维系统。数据中心的规模,是判断一家公司 AI 实力最直观的指标之一。

        数据中心就是 AI 行业的超级大型发电厂 + 大型学堂,源源不断供给算力,支撑 AI 学习与日常运行。是汇聚海量算力硬件的专业大型机房,是承载 AI 训练与推理最核心的物理基建。

3.4 算力集群

        单台显卡 = 单人干活,算力集群 = 千人团队一起组队干活,效率翻倍。把成千上万张 GPU 连接在一起,形成的超大规模的计算机系统,整合算力统一调度协同工作,就是算力集群,算力集群是多台算力设备组网聚合而成的运算主力,是 AI 训练、推理最核心的算力载体,属于底层基建核心。

        算力集群的规模直接决定了一个公司能训练多强的大模型。

四、芯片层・AI 动力核心硬件

4.1 芯片概述

        芯片是 AI 的发动机:芯片是 AI 的核心硬件,是 AI 运行的终极动力,没有芯片就没有 AI。英伟达和台积电是芯片领域的重要企业。

4.2 GPU (图形处理器)

        GPU: 图形处理器,AI 行业俗称显卡, 如果你自己攒一台电脑,应该听说过 GPU ,显卡,比如 5060 等,不管是电脑的 GPU 还是 AI 使用的 GPU 本质都是图形并行计算芯片,底层运算逻辑、算力架构同源,都能做浮点运算、并行计算,理论上游戏显卡也能跑 AI 训练推理。

        游戏显卡:主流 8G/12G/16G 显存,上限低, AI 专业 GPU:H100/A100 可达 80G/94G 显存,AI 跑大模型极度吃显存,游戏卡显存太小装不下大模型权重。

        这里讲一下为什么 AI 要使用 GPU 而不是 CPU, 核心原因要结合 AI 训练底层逻辑来看:AI 训练本质只做一件事,就是反复进行海量重复的矩阵乘法与浮点运算,不断计算误差、调整模型参数,让模型自主学习语言规律。整个训练过程几乎没有复杂逻辑判断,全部都是大批量、同类型的重复性计算。

        AI 本身并不具备真正的理解能力,也不存在人类式的思维感悟,它更不像擅长感悟表达的文科生,本质从头到尾都在做海量数学运算。它只会通过不断计算概率,判断语句字词、乃至画面像素依次出现的概率高低,最终依照算出的概率结果,依次输出对应的内容,所有生成结果,全都依托纯粹的数学概率运算得来。

        我们都清楚,CPU 主打逻辑运算,它计算核心数量少,但单核性能极强,擅长逻辑判断、任务调度以及复杂流程处理,适合统筹统筹全局,并不适合大批量重复性的算力工作。而 AI 训练流程如同流水线作业,需要同时处理海量文本向量,数十万组相同计算同步开展,GPU 强大的并行计算能力刚好完美契合这类需求,依靠串行运算的 CPU 速度远远跟不上训练节奏。

        就好比 AI 训练是批量作答 1+1=2 这类基础简单计算题,这类低难度统一运算,GPU 完全能够轻松胜任,CPU 虽说也能完成,但完全属于大材小用。CPU 更适合解答逻辑推理、高等微积分这类高难度复杂题型。

        简单类比:AI 训练就是堆积如山、题型一致的苦力计算题。CPU 如同善于深度思考的学霸,擅长钻研难题;GPU 则是上万名协同作业的流水线工人,能够同步批量完成海量简单运算。面对这种纯重复的算力工作,群体协作的 GPU 效率远远高于单核思考的 CPU。

        总而言之,AI 训练依托大规模并行矩阵运算完成,CPU 偏向复杂逻辑串行处理,GPU 具备海量计算核心、超高并行算力以及大带宽高速显存,天生适配批量重复性运算,综合运算效率远超 CPU,因此 GPU 成为 AI 训练的首选硬件。

4.3 算力

        算力就是设备进行计算运算的能力,简单说就是电脑、显卡干活快慢、计算能力强弱,是 AI 最核心的硬实力,属于 AI 基础设施层。打个比方就是 AI 的燃料,燃料质量越高,燃烧效率越高,越强,放到 AI 上那就是:

算力越强,运算速度越快:

  • 训练模型用时更短
  • 同时承载更多用户使用不卡顿
  • 能撑起更大参数规模的大模型
  • 能流畅运行超长上下文、复杂 AI 任务

4.4 芯片

        前面说到 AI 本质全程都在做海量数学运算,这些庞大的计算量,必须依靠专业芯片来高效完成。想要释放充足算力,就离不开各类运算芯片作为支撑。

        芯片堪称所有智能硬件的核心心脏,AI 能否顺利运行、运算效率高低,最终都取决于这一枚枚体积仅有指甲盖大小的核心元器件。除了我们常说的 GPU 之外,AI 领域还有多款专用算力芯片,例如专为 AI 运算设计的 TPU(谷歌专属芯片)、NPU(嵌入式端 AI 芯片)等,各司其职分担不同场景下的计算任务。

4.5 CUDA (并行计算架构)

        CUDA 是英伟达专为高速并行运算打造的技术架构,也是连接程序与 GPU 的专用通道,如同一位专属翻译官,能让 AI 模型和各类开发程序顺畅调用 GPU 强大算力,完成海量高速运算。倘若没有 CUDA,GPU 再强的硬件性能也无法充分释放,AI 便没法借助 GPU 实现高效计算。         CUDA 更是英伟达稳固行业地位的核心护城河,它不属于实体硬件,却是不可或缺的软件生态根基。如今全球绝大多数 AI 开发者与开发框架都深度依托这套体系,整个 AI 开发生态早已深度绑定,难以轻易脱离。

        不过当下行业内也涌现出诸多技术方案,力求摆脱对 CUDA 的依赖。其中 AMD 推出的 ROCm 是主流开源替代方案,搭配 HIP 语言可快速迁移原有 CUDA 代码,适配自家算力显卡开展 AI 运算;华为自研的 CANN 架构,深度适配昇腾系列 AI 芯片,打造出完整的国产软硬件算力体系,实现脱离 CUDA 独立运行大模型;谷歌则依靠 TPU 芯片搭配 XLA 编译器,搭建起自成一体的专属运算生态,全程不接入 CUDA 体系。除此之外,还有 SYCL、Triton 等跨平台通用开发架构,能够兼容多款品牌算力芯片,实现代码多硬件通用,从开发层面弱化 CUDA 的绑定作用,越来越多自研软件架构正在慢慢打破这一生态壁垒。

4.6 芯片出口管制

        AI 的飞速发展,注定会重塑全新的世界格局,谁率先掌握顶尖人工智能技术,谁就能牢牢抓住新时代的发展风口与战略先机。而人工智能的发展根基始终离不开高端芯片,正所谓得芯片者得天下,这早已不再只是商业盈利层面的竞争,更是实打实的大国实力博弈。

        在此背景之下,部分国家为遏制他国人工智能产业崛起,刻意实施芯片技术封锁与出口限制,手握高端算力芯片与核心技术却禁止对外供应,以此卡住对方算力发展命脉,试图阻碍他国 AI 产业稳步前行,这也让芯片与 AI 领域的竞争,彻底上升到了国家战略博弈的高度。

五、能源层・AI 产业最底层保障

5.1 算力成本

        所谓算力成本,就是训练、运行 AI 模型所产生的全部开销,其中涵盖芯片硬件损耗费用、大额电力消耗费用、机房设备运维费用、场地人力费用等多项支出。成本里芯片开销占据最大比重,一枚英伟达顶尖 AI 芯片单价就达到五位数,而搭建算力集群、开展大模型训练,往往需要大批量芯片堆叠采购,硬件投入十分高昂。紧随其后的就是电费成本,数据中心与算力集群需要二十四小时不间断供电持续运转,整体耗电量极其庞大。

        能源层作为最底层保障,一旦能够实现电力供给降本增效,大幅压低用电成本,就能直接整体下拉整体算力成本。不仅可以拓宽各类 AI 产品与服务的定价浮动空间,让产品在市场中更具价格优势,也能让企业在行业竞争中掌握更大主动权,拥有更充足的发展底气与盈利空间。

5.2 电力消耗

        训练与运行 AI 大模型,全程需要耗费规模极其庞大的电力资源。一座大型 AI 数据中心的整体耗电量,甚至能比肩一座小型城市的日常用电总量,算力集群全天候满负荷运转,电力损耗体量十分惊人。从底层逻辑来看,所有算力运转、芯片运算、设备运维全都依靠电力支撑,没有充足且廉价的能源供给,AI 产业规模化发展便无从谈起,毫不夸张地说,AI 的尽头就是能源。

5.3 清洁能源与核电

        前文讲到,AI 训练与算力产业发展的尽头就是能源。想要保障大型算力中心全天候稳定运转,同时实现降本增效、减少碳排放,大力发展核电、光伏太阳能、风力发电、水力发电等清洁能源已是必然趋势。依靠这类清洁低碳能源产出电力,既能源源不断为算力中心提供稳定充足电能,支撑大规模 AI 训练与推理业务平稳运行,还能从根源上压低用电成本,兼顾产业发展与绿色环保双重需求。

六、MCP(Model Context Protocol,模型上下文协议)

        由 Anthropic(Claude 研发公司)在 2024 年 11 月推出的开放标准协议,一次开发、全模型可用,支持复杂多工具协同、权限可控、易迁移。

        MCP 模型上下文协议,属于跨层通用通信协议层,独立于五层蛋糕之外,负责打通大模型、工具、数据库、知识库、各类外部服务。

        简单说就是 AI 的 “USB‑C 万能接口”,让大模型能统一、安全地连上各种数据和工具, 给大模型和外部世界(数据库、API、文件、工具)提供统一 “插头”,一次适配、到处可用。

举例:

  • RAG 知识库:本地文档 / 企业数据库包装成 MCP 服务,任意大模型直接检索,不用重复开发对接。
  • Vibe Coding(AI 编程):IDE 通过 MCP 调用文件系统、终端、Git、数据库,自然语言就能全链路开发。
  • 智能办公:MCP 连接 Notion、Slack、邮箱、日历,AI 自动汇总消息、生成周报、排会议。
  • 实时数据问答:接入天气、股票、订单 API,模型直接查实时数据并回答。

如果说,五层蛋糕是 AI 从上到下整体产业架构,是行业通用对接标准,用来连通五层里各个模块,RAG、Workflow、Skills 这类功能,都能依靠 MCP 统一对接调用。简单理解的话,五层是楼房主体,MCP 是整栋楼通用互通管线。

写在最后

        看完这一整套从底层能源、芯片算力,再到大模型、上层应用的 AI 名词干货,那些听着高深莫测的行业黑话,是否觉得也没那么晦涩难懂了?

        如今 AI 早已不是遥不可及的前沿科技,而是悄悄融入日常、助力工作的实用工具。不必抵触恐慌,也不用焦虑被替代,科技发展的初衷从来不是淘汰人,而是帮人减负增效。时代风口滚滚向前,人工智能早已悄悄渗透进我们生活、工作、学习的方方面面。

        我们现在处于 AI 大爆发,时代大变革的时代,不如就趁现在主动拥抱 AI,学会善用 AI 当帮手,把繁琐重复的工作交给它,腾出更多精力去精进自己、沉淀成长。顺势抓住时代风口,借着智能科技的东风,轻松提升效率、拓宽眼界,让 AI 成为我们前行路上最靠谱的得力搭档。借 AI 之力为自己赋能提速,才能在新时代里站稳脚步、越走越顺。

        最后最后,码字不易,全文尽量用通俗易懂的语言进行了 AI 的名词解释,希望读完后对你了解 AI 行业有所帮助,觉得有用的朋友,请不要吝啬你的收藏点赞与转发。

文中如有理解偏差或者讲解不周的地方,欢迎各路大佬在评论区讨论留言指点。

                                                                                                        

        ps:本文中部分引用图片由AI生成。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐