大模型 100 词(严格按 B 站视频顺序 + 逐词详解)

原文来源:B 站 UP 主【飞天闪客】《一小时从函数到 Transformer》P7《速览大模型 100 词》本文用途:大模型入门必备、核心知识梳理、AI 面试备考排版说明

https://www.bilibili.com/video/BV1NCgVzoEG9


一、前言

本文严格按照视频讲解顺序,整理了大模型核心 100 个词汇,每个词语附带视频中对应的原版解释,覆盖大模型基础原理、训练部署、优化发展、生态应用全维度,适合 AI 入门者快速掌握核心概念,可直接作为学习笔记或入门教程使用。


二、大模型 100 词(按视频顺序 + 逐词解释)

  1. 函数:世界上所有逻辑和知识都可以用函数表示,是大模型最底层的数学基础
  2. 符号主义:早期 AI 思想,试图用精确规则和函数描述世界规律,无法处理复杂任务
  3. 连接主义:现代 AI 核心思想,不追求精确函数,通过近似拟合解决复杂问题
  4. 模型:用于处理任务、预测输出的数学结构集合
  5. 权重:模型内部的未知参数,训练过程中不断被调整
  6. 大模型:参数量规模极其庞大的人工智能模型
  7. 大语言模型:专门用于处理自然语言文本的大模型
  8. 训练:根据模型预测值与真实值的误差,不断调整权重的过程
  9. 预训练:在海量通用数据上,提前训练得到基础能力模型
  10. 微调参数:在预训练模型基础上,用特定任务数据继续小范围调整参数
  11. 推理:模型训练完成后,输入信息计算并输出结果的过程
  12. 涌现:模型参数量达到一定规模后,突然出现的全新能力
  13. ChatGPT:OpenAI 推出的现象级对话产品,引爆大模型时代
  14. GPT:OpenAI 开发的系列大语言模型架构
  15. OpenAI:研发 ChatGPT、GPT 系列的人工智能公司
  16. 闭源:不对外开放模型核心代码与权重
  17. 闭源模型:仅提供在线服务,不开放权重与训练代码的模型
  18. 训练代码:用于训练模型的程序代码
  19. 开源模型:对外公开权重或代码,可以下载使用的模型
  20. 开放权重模型:只开放模型权重,不开放完整训练流程的模型
  21. DeepSeek:典型的开放权重大模型
  22. Llama:Meta 开源的主流大语言模型
  23. 完全开源模型:开放模型结构、权重、训练代码的全透明模型
  24. Moss:国内代表性完全开源大模型
  25. 私有化部署:将模型下载到本地服务器 / 设备运行使用
  26. 环境配置:搭建模型运行所需的软件、依赖、系统设置
  27. 依赖包:模型运行必须安装的第三方软件库
  28. GPU:训练和运行大模型必需的高性能显卡算力硬件
  29. 云桌面:云端提供的打包好 AI 环境的远程桌面
  30. 镜像:预先配置好软件、环境、模型的系统模板
  31. 生成式 AI:可以自动生成文本、图片、音视频等新内容的 AI
  32. Token:大语言模型处理文本的最小分割单元
  33. 上下文:模型对话过程中接收的全部历史信息
  34. 提示词(Prompt):用户输入给模型的指令与信息
  35. 提示词工程师:通过优化指令让模型输出更精准的职业
  36. 温度:控制模型输出结果随机性的参数
  37. Top K:模型从概率最高的 K 个词里选择下一个词
  38. 幻觉:模型输出语言通顺,但内容与事实不符的错误现象
  39. 联网能力:模型可以实时联网获取最新信息的功能
  40. 检索增强生成(RAG):先检索知识库再生成答案,解决幻觉
  41. 知识库:存储私有专业知识的数据库
  42. 向量数据库:以向量形式存储和检索知识的数据库
  43. 词嵌入:将文字转化为模型可理解的数值向量
  44. 向量检索:通过向量相似度匹配查找相关知识
  45. PGC:专业机构或专家创作的内容
  46. UGC:普通用户自主创作的内容
  47. AIGC:由人工智能生成或辅助生成的内容
  48. 洗稿:AI 低质量改写内容,造成信息污染
  49. AGI:通用人工智能,具备全面人类智能水平的 AI 形态
  50. 多模态:能同时处理文本、图片、语音、视频的模型能力
  51. 工作流:将多个模型步骤编排成自动化执行流程
  52. 智能体:封装大模型 + 工具,能自主完成复杂任务的程序
  53. 多智能体:多个智能体相互协作完成任务
  54. AutoGPT:经典的自主 AI 智能体框架
  55. MCP:AI 操作外部世界的标准化接口协议
  56. A2A 协议:智能体之间互相通信的标准协议
  57. 模型压缩:减小模型体积、提升运行速度的技术
  58. 量化:用低精度数值表示参数,减少显存占用
  59. 蒸馏:用大模型指导小模型训练,保留能力
  60. 剪枝:删除模型中不重要的神经元,精简结构
  61. LoRA:低成本高效微调模型的主流技术
  62. KoRA:LoRA 的优化改进版本微调方法
  63. Adapter:在模型中插入小模块实现轻量化微调
  64. 思维链:让模型分步推理,提升复杂问题解决能力
  65. RLHF:人类反馈强化学习,让模型输出更符合人类需求
  66. 套壳服务:基于开源模型封装界面,提供对外 AI 服务
  67. AI 工具:基于大模型开发的各类效率工具
  68. AI 服务:大模型提供的 API 调用、解决方案等服务
  69. AI 课程:人工智能相关教学培训课程
  70. AI 社区:AI 开发者、爱好者交流分享的平台
  71. 卖铲子:比喻 AI 时代提供工具、课程、服务的周边生态
  72. 自然语言处理(NLP):让机器理解和生成人类语言的技术
  73. Gemini:谷歌推出的多模态大模型
  74. 豆包:国内主流通用大模型产品
  75. 千问:阿里云推出的大语言模型
  76. 腾讯元宝:腾讯旗下大模型产品
  77. 计算机视觉:让机器看懂图像、视频的 AI 技术
  78. Midjourney:主流 AI 绘画生成模型
  79. Stable Diffusion:开源 AI 绘画主流框架
  80. ComfyUI:Stable Diffusion 可视化流程编辑工具
  81. TTS:文字转语音技术
  82. ASR:语音转文字技术
  83. SORA:OpenAI 推出的文本生成视频模型
  84. 可灵:国内 AI 视频生成工具
  85. 梦:国内 AI 视频生成模型
  86. 数字人:AI 驱动的虚拟人物形象与交互主体
  87. CUDA:英伟达 GPU 专用的并行计算框架
  88. TPU:谷歌推出的 AI 专用芯片
  89. NPU:专门用于神经网络计算的加速芯片
  90. Python:AI 与大模型开发最主流编程语言
  91. Pytorch:全球最流行的深度学习开发框架
  92. Tensorflow:谷歌推出的深度学习框架
  93. Hugging face:全球最大开源 AI 模型社区平台
  94. 欧拉马:本地快速运行大模型的工具
  95. vLLM:高性能大模型推理加速引擎
  96. Cursor:内置 AI 能力的代码编辑器
  97. GitHub Copilot:微软推出的 AI 编程助手工具
  98. 线性代数:大模型必需的核心数学基础
  99. 微积分:训练模型必备的数学知识
  100. Transformer 架构:当前所有大模型的核心基础网络结构
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐