大模型 100 词
·
大模型 100 词(严格按 B 站视频顺序 + 逐词详解)
原文来源:B 站 UP 主【飞天闪客】《一小时从函数到 Transformer》P7《速览大模型 100 词》本文用途:大模型入门必备、核心知识梳理、AI 面试备考排版说明
一、前言
本文严格按照视频讲解顺序,整理了大模型核心 100 个词汇,每个词语附带视频中对应的原版解释,覆盖大模型基础原理、训练部署、优化发展、生态应用全维度,适合 AI 入门者快速掌握核心概念,可直接作为学习笔记或入门教程使用。
二、大模型 100 词(按视频顺序 + 逐词解释)
- 函数:世界上所有逻辑和知识都可以用函数表示,是大模型最底层的数学基础
- 符号主义:早期 AI 思想,试图用精确规则和函数描述世界规律,无法处理复杂任务
- 连接主义:现代 AI 核心思想,不追求精确函数,通过近似拟合解决复杂问题
- 模型:用于处理任务、预测输出的数学结构集合
- 权重:模型内部的未知参数,训练过程中不断被调整
- 大模型:参数量规模极其庞大的人工智能模型
- 大语言模型:专门用于处理自然语言文本的大模型
- 训练:根据模型预测值与真实值的误差,不断调整权重的过程
- 预训练:在海量通用数据上,提前训练得到基础能力模型
- 微调参数:在预训练模型基础上,用特定任务数据继续小范围调整参数
- 推理:模型训练完成后,输入信息计算并输出结果的过程
- 涌现:模型参数量达到一定规模后,突然出现的全新能力
- ChatGPT:OpenAI 推出的现象级对话产品,引爆大模型时代
- GPT:OpenAI 开发的系列大语言模型架构
- OpenAI:研发 ChatGPT、GPT 系列的人工智能公司
- 闭源:不对外开放模型核心代码与权重
- 闭源模型:仅提供在线服务,不开放权重与训练代码的模型
- 训练代码:用于训练模型的程序代码
- 开源模型:对外公开权重或代码,可以下载使用的模型
- 开放权重模型:只开放模型权重,不开放完整训练流程的模型
- DeepSeek:典型的开放权重大模型
- Llama:Meta 开源的主流大语言模型
- 完全开源模型:开放模型结构、权重、训练代码的全透明模型
- Moss:国内代表性完全开源大模型
- 私有化部署:将模型下载到本地服务器 / 设备运行使用
- 环境配置:搭建模型运行所需的软件、依赖、系统设置
- 依赖包:模型运行必须安装的第三方软件库
- GPU:训练和运行大模型必需的高性能显卡算力硬件
- 云桌面:云端提供的打包好 AI 环境的远程桌面
- 镜像:预先配置好软件、环境、模型的系统模板
- 生成式 AI:可以自动生成文本、图片、音视频等新内容的 AI
- Token:大语言模型处理文本的最小分割单元
- 上下文:模型对话过程中接收的全部历史信息
- 提示词(Prompt):用户输入给模型的指令与信息
- 提示词工程师:通过优化指令让模型输出更精准的职业
- 温度:控制模型输出结果随机性的参数
- Top K:模型从概率最高的 K 个词里选择下一个词
- 幻觉:模型输出语言通顺,但内容与事实不符的错误现象
- 联网能力:模型可以实时联网获取最新信息的功能
- 检索增强生成(RAG):先检索知识库再生成答案,解决幻觉
- 知识库:存储私有专业知识的数据库
- 向量数据库:以向量形式存储和检索知识的数据库
- 词嵌入:将文字转化为模型可理解的数值向量
- 向量检索:通过向量相似度匹配查找相关知识
- PGC:专业机构或专家创作的内容
- UGC:普通用户自主创作的内容
- AIGC:由人工智能生成或辅助生成的内容
- 洗稿:AI 低质量改写内容,造成信息污染
- AGI:通用人工智能,具备全面人类智能水平的 AI 形态
- 多模态:能同时处理文本、图片、语音、视频的模型能力
- 工作流:将多个模型步骤编排成自动化执行流程
- 智能体:封装大模型 + 工具,能自主完成复杂任务的程序
- 多智能体:多个智能体相互协作完成任务
- AutoGPT:经典的自主 AI 智能体框架
- MCP:AI 操作外部世界的标准化接口协议
- A2A 协议:智能体之间互相通信的标准协议
- 模型压缩:减小模型体积、提升运行速度的技术
- 量化:用低精度数值表示参数,减少显存占用
- 蒸馏:用大模型指导小模型训练,保留能力
- 剪枝:删除模型中不重要的神经元,精简结构
- LoRA:低成本高效微调模型的主流技术
- KoRA:LoRA 的优化改进版本微调方法
- Adapter:在模型中插入小模块实现轻量化微调
- 思维链:让模型分步推理,提升复杂问题解决能力
- RLHF:人类反馈强化学习,让模型输出更符合人类需求
- 套壳服务:基于开源模型封装界面,提供对外 AI 服务
- AI 工具:基于大模型开发的各类效率工具
- AI 服务:大模型提供的 API 调用、解决方案等服务
- AI 课程:人工智能相关教学培训课程
- AI 社区:AI 开发者、爱好者交流分享的平台
- 卖铲子:比喻 AI 时代提供工具、课程、服务的周边生态
- 自然语言处理(NLP):让机器理解和生成人类语言的技术
- Gemini:谷歌推出的多模态大模型
- 豆包:国内主流通用大模型产品
- 千问:阿里云推出的大语言模型
- 腾讯元宝:腾讯旗下大模型产品
- 计算机视觉:让机器看懂图像、视频的 AI 技术
- Midjourney:主流 AI 绘画生成模型
- Stable Diffusion:开源 AI 绘画主流框架
- ComfyUI:Stable Diffusion 可视化流程编辑工具
- TTS:文字转语音技术
- ASR:语音转文字技术
- SORA:OpenAI 推出的文本生成视频模型
- 可灵:国内 AI 视频生成工具
- 梦:国内 AI 视频生成模型
- 数字人:AI 驱动的虚拟人物形象与交互主体
- CUDA:英伟达 GPU 专用的并行计算框架
- TPU:谷歌推出的 AI 专用芯片
- NPU:专门用于神经网络计算的加速芯片
- Python:AI 与大模型开发最主流编程语言
- Pytorch:全球最流行的深度学习开发框架
- Tensorflow:谷歌推出的深度学习框架
- Hugging face:全球最大开源 AI 模型社区平台
- 欧拉马:本地快速运行大模型的工具
- vLLM:高性能大模型推理加速引擎
- Cursor:内置 AI 能力的代码编辑器
- GitHub Copilot:微软推出的 AI 编程助手工具
- 线性代数:大模型必需的核心数学基础
- 微积分:训练模型必备的数学知识
- Transformer 架构:当前所有大模型的核心基础网络结构
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)