AI技术架构全局视角

wggmrlee

418人浏览 · 2026-03-26 10:30:48

wggmrlee · 2026-03-26 10:30:48 发布

AI技术架构全局视角

一、AI/ML/DL/NLP 关系图谱

给机器一堆数据 → 让它自动找到规律 → 以后能自己预测 / 生成

B站上录制了对应视频： 🚀 后端工程师转型AI？理解LLM原理的开发者

核心关系理解

层级	名称	一句话理解
最外层	AI	让机器展现智能行为的所有技术
中层	ML	AI的子集，通过数据学习而非硬编码规则
内层	DL	ML的子集，使用多层神经网络
应用层	NLP	DL的一个应用方向，处理人类语言

后端类比：

AI ≈ 整个后端系统
ML ≈ 业务逻辑层（根据输入计算输出）
DL ≈ 复杂的微服务架构（多层处理）
NLP ≈ 特定的API服务（如翻译接口）

二、技术栈分层架构

各层详解

1. 基础层（Infrastructure）

Python：AI领域的主流语言
CUDA/GPU：并行计算能力，加速训练
NumPy/Pandas：数据处理的基础库

2. 框架层（Frameworks）

PyTorch：目前最流行，动态图，调试友好
TensorFlow：Google出品，生产部署成熟
Transformers：Hugging Face的模型库，调用预训练模型

3. 模型层（Models）

大语言模型：GPT、Claude、LLaMA等
BERT系列：理解型任务
专用模型：针对特定任务优化

4. 应用层（Applications）

各种AI产品和服务

三、学习路径建议

学习建议

阶段	学习内容	时间建议	目标
1	基础概念	1天	建立全局认知
2	机器学习	3-5天	理解核心范式
3	深度学习	5-7天	理解神经网络
4	NLP	3-5天	理解语言模型
5	模型训练	3-5天	掌握训练流程
6	RAG应用	持续	实际应用能力

四、核心术语速查

术语	英文	简单理解
模型	Model	一个数学函数，输入→输出
训练	Training	用数据调整模型参数
推理	Inference	用训练好的模型处理新数据
损失函数	Loss Function	衡量模型预测与真实值的差距
优化器	Optimizer	调整参数的算法
超参数	Hyperparameter	训练前设置的参数
批次	Batch	一次训练的样本数量
轮次	Epoch	遍历全部训练数据一次
过拟合	Overfitting	模型"死记硬背"训练数据
泛化	Generalization	模型处理未见数据的能力

五、后端工程师视角

AI模型 vs 传统后端服务

关键差异

维度	传统后端	AI服务
逻辑	确定性规则	概率性预测
输出	相同输入=相同输出	相同输入可能有不同输出
资源	CPU为主	GPU为主
延迟	通常<100ms	可能需要数秒
调试	断点+日志	需要分析模型行为
部署	容器化	需要GPU支持

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【AI技能】跟着费曼学控制执行

AtomGit开源社区

大模型算法工程师、Agent智能体工程师、AI应用架构师的求职者准备的系统设计深度指南

AtomGit开源社区

AI Agent Harness Engineering 创业护城河分析：数据壁垒、场景深度与微调成本的三角博弈

这就是我们今天这篇文章要讨论的核心问题：在AI Agent创业的红海中，数据壁垒、场景深度、微调成本这三个要素构成了一个铁三角——任何一个要素的缺失或者失衡，都会让你的产品被瞬间抄袭、或者根本无法盈利、或者无法规模化。首先，严格定义Harness类Agent——把它和简单的Chatbot、通用插件链、封装RAG的行业大模型助手、甚至是OpenAI最新推出的GPTs Custom Agents区分开