大模型常用词汇总结
前言:
学习大模型之前首先我们需要熟悉各种常用词汇代表的含义,下面不断总结更新我们常见词汇,帮助我们理解记忆:
根据整体流程框架总览:
一、模型 / 机构类
LLM — Large Language Model — 大语言模型
SLM — Small Language Model — 小语言模型
MoE — Mixture of Experts — 混合专家模型
AGI — Artificial General Intelligence — 通用人工智能
OpenAI — OpenAI — 开放人工智能(机构名)
GPT — Generative Pre-trained Transformer — 生成式预训练 Transformer
DeepSeek — DeepSeek — 深度求索(模型 / 机构)
Qwen — Qwen — 通义千问
Llama — Llama — Meta 开源大模型
GLM — General Language Model — 通用语言模型(智谱)二、架构 / 技术类
Transformer — Transformer — Transformer 架构(大模型基础)
Encoder — Encoder — 编码器
Decoder — Decoder — 解码器
RNN — Recurrent Neural Network — 循环神经网络
CNN — Convolutional Neural Network — 卷积神经网络
ANN — Approximate Nearest Neighbor — 近似最近邻搜索
NN — Neural Network — 神经网络
DNN — Deep Neural Network — 深度神经网络三、训练 / 微调类
Pre-training — Pre-training — 预训练
SFT — Supervised Fine-Tuning — 监督微调
RLHF — Reinforcement Learning from Human Feedback — 基于人类反馈的强化学习
DPO — Direct Preference Optimization — 直接偏好优化
LoRA — Low-Rank Adaptation — 低秩适配(轻量微调)
QLoRA — Quantized LoRA — 量化低秩适配
FT — Fine-Tuning — 全参数微调四、推理 / 部署类
Inference — Inference — 推理
Context Window — Context Window — 上下文窗口
Token — Token — 词元(文本基本单位)
vLLM — Virtual Large Language Model — 高效大模型推理引擎
TPU — Tensor Processing Unit — 张量处理器
GPU — Graphics Processing Unit — 图形处理器(训练 / 推理常用)
API — Application Programming Interface — 应用程序编程接口
SDK — Software Development Kit — 软件开发工具包五、NLP & 向量相关
NLP — Natural Language Processing — 自然语言处理
Embedding — Embedding — 词嵌入 / 向量表示
RAG — Retrieval-Augmented Generation — 检索增强生成
Vector DB — Vector Database — 向量数据库
Semantic Search — Semantic Search — 语义搜索六、任务 / 能力类
NLG — Natural Language Generation — 自然语言生成
NLU — Natural Language Understanding — 自然语言理解
MT — Machine Translation — 机器翻译
QA — Question Answering — 问答
CoT — Chain-of-Thought — 思维链
基本概念:
第一部分 机器学习与深度学习基础
一、基础概念
- 机器学习:Machine Learning (ML)
- 人工智能:Artificial Intelligence (AI)
- 深度学习:Deep Learning (DL)
- 模型:Model
- 训练:Training
- 推理 / 预测:Inference / Prediction
- 参数:Parameter
- 超参数:Hyperparameter
二、数据相关
- 数据集:Dataset
- 训练集:Training Set
- 验证集:Validation Set
- 测试集:Test Set
- 特征:Feature
- 标签 / 目标:Label / Target
- 样本:Sample / Instance
- 标注:Annotation
- 归一化:Normalization
- 标准化:Standardization
三、学习范式
- 监督学习:Supervised Learning
- 无监督学习:Unsupervised Learning
- 半监督学习:Semi-supervised Learning
- 强化学习:Reinforcement Learning (RL)
- 迁移学习:Transfer Learning
四、任务类型
- 分类:Classification
- 回归:Regression
- 聚类:Clustering
- 降维:Dimensionality Reduction
- 生成:Generation
五、经典算法
- 线性回归:Linear Regression
- 逻辑回归:Logistic Regression
- K 近邻:KNN
- 决策树:Decision Tree
- 随机森林:Random Forest
- 支持向量机:SVM
- 朴素贝叶斯:Naive Bayes
- K-Means:K-Means
- 主成分分析:PCA
六、深度学习
- 神经网络:Neural Network
- 卷积神经网络:CNN
- 循环神经网络:RNN
- Transformer:Transformer
- 激活函数:Activation Function
- 前向传播:Forward Propagation
- 反向传播:Backpropagation
- 梯度下降:Gradient Descent
- 学习率:Learning Rate
- 批次:Batch
- 迭代轮数:Epoch
七、损失与优化
- 损失函数:Loss Function
- 均方误差:MSE
- 交叉熵:Cross Entropy
- 梯度:Gradient
- 正则化:Regularization
- 早停:Early Stopping
八、评估指标
- 准确率:Accuracy
- 精确率:Precision
- 召回率:Recall
- F1 分数:F1 Score
- 混淆矩阵:Confusion Matrix
- 过拟合:Overfitting
- 欠拟合:Underfitting
- 泛化能力:Generalization
第二部分 大模型发展及关键技术
一、基础与范式
- 大语言模型 – Large Language Model (LLM)
- 基础模型 – Foundation Model
- 预训练 – Pre-training
- 微调 – Fine-tuning
- 指令微调 – Instruction Tuning
- 对齐 – Alignment
二、架构与核心模块
- Transformer – Transformer
- 编码器 – Encoder
- 解码器 – Decoder
- 自注意力 – Self-Attention
- 多头注意力 – Multi-Head Attention
- 位置编码 – Positional Encoding
三、训练与优化
- 上下文窗口 – Context Window
- 参数量 – Parameter Count
- token – 令牌 / 词元
- 分词器 – Tokenizer
- 批量大小 – Batch Size
- 学习率 – Learning Rate
- 优化器 – Optimizer
- 分布式训练 – Distributed Training
四、高效与工程
- 稀疏注意力 – Sparse Attention
- 量化 – Quantization
- LoRA – 低秩适配
- 推理 – Inference
- 显存 – GPU Memory / VRAM
五、能力与评估
- 涌现能力 – Emergent Abilities
- 思维链 – Chain-of-Thought (CoT)
- 少样本学习 – Few-shot Learning
- 零样本学习 – Zero-shot Learning
- 幻觉 – Hallucination
六、对齐与安全
- RLHF – 基于人类反馈的强化学习
- DPO – 直接偏好优化
- 红队测试 – Red Teaming
- 安全对齐 – Safety Alignment
七、多模态与扩展
- 多模态大模型 – Multimodal LLM
- 图文对齐 – Vision-Language Alignment
- RAG – 检索增强生成
- Agent – 智能体
- 工具使用 – Tool Use
- 长文本理解 – Long-Context Understanding
关键技术应用场景:
第一部分 提示工程(prompt)
一、核心基础
1、提示工程 – Prompt Engineering
2、提示 / 提示词 – Prompt
3、指令 – Instruction
4、上下文 – Context
5、输入提示 – Input Prompt
6、输出响应 – Output Response
7、提示模板 – Prompt Template
二、提示设计与结构
1、少样本提示 – Few-shot Prompting
2、零样本提示 – Zero-shot Prompting
3、思维链提示 – Chain-of-Thought (CoT) Prompting
4、逐步提示 – Step-by-Step Prompting
5、角色提示 – Role Prompting
6、约束提示 – Constraint Prompting
7、示例演示 – Demonstration (Few-shot 中的示例)
8、格式指定 – Format Specification
9、任务描述 – Task Description
三、进阶优化技巧
1、提示调优 – Prompt Tuning
2、自动提示工程 – Automatic Prompt Engineering (APE)
3、提示增强 – Prompt Enhancement
4、提示精炼 – Prompt Refinement
5、反提示 – Anti-Prompt (避免模型生成特定内容)
6、元提示 – Meta-Prompt (指导模型生成提示)
7、多阶段提示 – Multi-Stage Prompting
8、提示链 – Prompt Chaining
四、落地应用与评估
1、上下文窗口 – Context Window
2、提示长度 – Prompt Length
3、响应一致性 – Response Consistency
4、提示鲁棒性 – Prompt Robustness
5、提示压缩 – Prompt Compression
6、领域适配提示 – Domain-Adapted Prompt
7、提示模板库 – Prompt Template Library
8、提示效果评估 – Prompt Evaluation
第二部分 检索增强生成-RAG(Retrieval-Augmented Generation)
一、核心基础
1、检索增强生成 – Retrieval-Augmented Generation (RAG)
2、大语言模型 – Large Language Model (LLM)
3、知识库 – Knowledge Base
4、向量数据库 – Vector Database
5、嵌入 / 向量嵌入 – Embedding / Vector Embedding
二、数据处理环节
1、文档加载 – Document Loading
2、文档分割 / 分块 – Document Splitting / Chunking
3、文本预处理 – Text Preprocessing
4、元数据 – Metadata
5、文档索引 – Document Indexing
三、检索核心环节
1、检索 – Retrieval
2、相似性搜索 – Similarity Search
3、余弦相似度 – Cosine Similarity
4、向量检索 – Vector Search
5、混合检索 – Hybrid Search(文本检索 + 向量检索)
6、召回率 – Recall
7、精确率 – Precision
8、Top-K 检索 – Top-K Retrieval
四、生成与优化环节
1、提示模板 – Prompt Template
2、上下文增强 – Context Enhancement
3、答案生成 – Answer Generation
4、引用溯源 – Citation / Source Attribution
5、去重 – Deduplication
6、过滤 – Filtering
7、重排 – Reranking
8、幻觉抑制 – Hallucination Mitigation
9、检索增强提示 – Retrieval-Augmented Prompting
五、工程落地
1、嵌入模型 – Embedding Model
2、检索器 – Retriever
3、生成器 – Generator
4、管道 / 工作流 – Pipeline / Workflow
5、批量处理 – Batch Processing
6、增量更新 – Incremental Update
7、缓存 – Caching
第三部分 Agent
一、大模型应用基础
- 大语言模型 – Large Language Model (LLM)
- 提示词 / 提示工程 – Prompt / Prompt Engineering
- 上下文窗口 – Context Window
- 上下文管理 – Context Management
- 检索增强生成 – Retrieval-Augmented Generation (RAG)
- 知识库 – Knowledge Base
- 向量数据库 – Vector Database
- 微调 / 指令微调 – Fine-tuning / Instruction Tuning
- 幻觉 – Hallucination
- 插件 / 工具调用 – Plugin / Tool Calling
二、Agent 核心概念
- 智能体 – Agent
- 自主智能体 – Autonomous Agent
- 多智能体系统 – Multi-Agent System (MAS)
- 规划 – Planning
- 推理 – Reasoning
- 记忆 – Memory
- 执行器 – Executor
- 观测 – Observation
- 行动 – Action
- 目标导向 – Goal-Oriented
三、Agent 架构与流程
- 思维链 – Chain-of-Thought (CoT)
- 反思 / 自我修正 – Reflection / Self-Correction
- 工具使用 – Tool Use
- 函数调用 – Function Calling
- 任务分解 – Task Decomposition
- 状态跟踪 – State Tracking
- 工作流 – Workflow
- 循环执行 – Loop / Iteration
四、记忆与上下文
- 短期记忆 – Short-term Memory
- 长期记忆 – Long-term Memory
- 情景记忆 – Episodic Memory
- 语义记忆 – Semantic Memory
- 记忆检索 – Memory Retrieval
- 记忆摘要 – Memory Summarization
五、交互与协同
- 人机交互 – Human-Agent Interaction
- 智能体协作 – Agent Collaboration
- 对话管理 – Dialogue Management
- 意图识别 – Intent Recognition
- 决策机制 – Decision Making
- 反馈闭环 – Feedback Loop
六、部署与工程
- 智能体框架 – Agent Framework
- 流水线 – Pipeline
- 中间件 – Middleware
- API 调用 – API Call
- 流式输出 – Streaming Output
- 并发控制 – Concurrency Control
- 可靠性 – Reliability
- 可解释性 – Interpretability
七、安全与对齐
- 对齐 – Alignment
- 红队测试 – Red Teaming
- 安全护栏 – Safety Guardrails
- 权限控制 – Permission Control
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)