【AI大模型百科专栏】开篇：从第一个大模型到未来——一部正在书写的历史

孤岛站岗

1419人浏览 · 2026-03-24 16:36:27

孤岛站岗 · 2026-03-24 16:36:27 发布

【AI大模型百科专栏】开篇：从第一个大模型到未来——一部正在书写的历史

🚀 专栏定位：这不是一个只介绍热门工具的入门帖，而是一部持续更新的AI大模型编年史。
从2017年Transformer架构诞生，到GPT改变世界，到DeepSeek震惊全球，再到未来还未出现的模型——只要AI在进化，本专栏就会一直更新下去。

🎯 适合人群：AI零基础新手 / 想系统了解AI发展脉络的人 / 对某个模型感兴趣想快速入门的人

一、为什么要做这个专栏？

AI大模型的发展速度，比任何人预想的都要快。

2017年，一篇论文《Attention Is All You Need》悄悄埋下了种子
2022年底，ChatGPT用5天突破100万用户，改变了世界对AI的认知
2025年初，DeepSeek用极低成本打出顶尖性能，震惊了整个硅谷
……未来还会发生什么，没人知道

面对这场席卷一切的技术浪潮，普通人最需要的，不是看懂论文，而是：

知道有哪些工具，它们能做什么，什么时候该用哪个。

这就是这个专栏存在的意义。

二、AI大模型的"诞生时间线"

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 2017  Transformer架构诞生（Google论文），奠定现代大模型基础
 2018  BERT（Google）发布，NLP领域革命
 2018  GPT-1（OpenAI）发布，语言生成初试
 2019  GPT-2（OpenAI）发布，"太危险不敢公开"
 2020  GPT-3（OpenAI）发布，1750亿参数震惊世界
 2021  GitHub Copilot发布，AI写代码进入实用阶段
 2022  ChatGPT发布（11月），AI进入大众视野
 2022  Stable Diffusion开源，AI绘图全民化
 2022  Midjourney公测，AI绘图惊艳全球
 2023  GPT-4发布，多模态时代开启
 2023  文心一言、通义千问、讯飞星火 国产大模型集中爆发
 2023  LLaMA（Meta）开源，开源生态爆炸式增长
 2023  Claude 1/2（Anthropic）发布
 2023  Gemini（Google）发布
 2023  Kimi（月之暗面）发布
 2024  Sora（OpenAI）发布，视频生成进入新纪元
 2024  可灵AI（快手）发布，国产视频AI崛起
 2024  GPT-4o、Claude 3.5，能力大幅跃升
 2024  豆包、即梦 字节AI产品矩阵成型
 2025  DeepSeek R1/V3 震惊全球，低成本高性能
 2025  Grok 3（xAI）发布，马斯克入局
 2025  各大模型持续迭代……
 未来  ？？？（持续更新中）
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

三、大模型的分类地图

按能力类型分

📝 文本/对话类
  ├── 国际：GPT系列、Claude、Gemini、Grok、LLaMA
  └── 国内：豆包、文心一言、通义千问、Kimi、讯飞星火、智谱GLM、DeepSeek

🎨 图像生成类
  ├── 国际：Midjourney、DALL·E、Stable Diffusion、Adobe Firefly
  └── 国内：即梦（字节）、文心一格（百度）、通义万相（阿里）

🎬 视频生成类
  ├── 国际：Sora（OpenAI）、Runway、Pika
  └── 国内：可灵AI（快手）、即梦视频（字节）、海螺AI（MiniMax）

🎵 音频/音乐生成类
  └── Suno、Udio、ElevenLabs

💻 代码专用类
  └── GitHub Copilot、Cursor、DeepSeek Coder、Qwen-Coder

按开源/闭源分

闭源（只能用API/产品）：
  GPT系列、Claude、Gemini、Midjourney、可灵AI

开源（可下载部署）：
  LLaMA（Meta）、Qwen/通义千问（阿里）
  DeepSeek（幻方量化）、Stable Diffusion、Mistral

按国籍分

🇺🇸 美国：OpenAI(GPT)、Anthropic(Claude)、Google(Gemini)、Meta(LLaMA)、xAI(Grok)
🇨🇳 中国：百度(文心)、字节(豆包/即梦)、阿里(通义)、快手(可灵)、
          月之暗面(Kimi)、幻方(DeepSeek)、科大讯飞(星火)、智谱(GLM)
🇫🇷 法国：Mistral AI

四、专栏文章目录（持续更新）

📚 第一章：奠基时代（2017-2021）

大模型的技术根基是怎么建立的？

篇号	文章标题	状态
A01	Transformer：改变一切的那篇论文	✅ 已发布
A02	BERT：让机器"读懂"语言的里程碑	✅ 已发布
A03	GPT-1/2/3：从"能写字"到"像人一样写"	✅ 已发布

📚 第二章：爆发时代（2022-2023）

ChatGPT横空出世，AI进入大众视野

篇号	文章标题	状态
B01	ChatGPT/GPT-4：AI界的"老大哥"	✅ 已发布
B02	Stable Diffusion：开源绘图，让AI绘画飞入寻常百姓家	✅ 已发布
B03	Midjourney：最惊艳的AI绘图工具	✅ 已发布
B04	Claude：最"懂文章"的AI	✅ 已发布
B05	LLaMA：Meta的开源大模型，撑起半个AI开源生态	✅ 已发布
B06	文心一言：百度的AI战略，国产大模型先行者	✅ 已发布
B07	通义千问：阿里的开源大模型	✅ 已发布
B08	讯飞星火：科大讯飞的AI大模型	✅ 已发布
B09	智谱GLM/ChatGLM：清华系开源大模型	✅ 已发布
B10	Gemini：Google的AI反击战	✅ 已发布
B11	Kimi：超长文本处理专家	✅ 已发布

📚 第三章：群雄时代（2024）

视频、多模态、Agent全面爆发

篇号	文章标题	状态
C01	Sora：OpenAI的视频生成，通向"世界模拟器"	✅ 已发布
C02	可灵AI：一句话生成视频，国产天花板	✅ 已发布
C03	豆包：字节出品，国内最好用的AI助手	✅ 已发布
C04	即梦：字节的AI创意神器	✅ 已发布
C05	GPT-4o：全能多模态，AI助手的新标杆	🔄 更新中

📚 第四章：颠覆时代（2025-）

成本革命与推理突破

篇号	文章标题	状态
D01	DeepSeek：用1/10成本打出顶尖性能，震惊硅谷	✅ 已发布
D02	Grok：马斯克的AI，最"敢说话"的大模型	✅ 已发布
D03	未来的模型……	🔜 持续更新

五、怎么用这个专栏？

👶 如果你是完全新手

按顺序从 B01（GPT） 开始读，每天一篇，两周后你就能和懂行的人聊AI了。

🎯 如果你想快速找到"适合自己的工具"

直接看下面这张表：

你的需求	推荐工具
日常对话、写作（国内）	豆包 / Kimi
处理超长PDF文档	Kimi / Claude
写代码	GPT / DeepSeek
AI绘图	GPT / Midjourney / 即梦
AI视频生成	可灵AI / 即梦
开源/本地部署	LLaMA / DeepSeek
Google生态用户	Gemini
最新信息/推理任务	DeepSeek / GPT-o

🔬 如果你对AI技术本身感兴趣

从 第一章（奠基时代） 开始，了解大模型是怎么一步步发展到今天的。

六、关于专栏更新说明

📢 本专栏承诺：

每当有重大的新模型发布，第一时间更新文章

每当已有模型发布重大新版本，更新对应文章

所有文章面向普通人，不要求任何数学或编程基础

文章永久免费，欢迎分享

七、一句话总结每个大模型

最后，送给你一张"速查名片"：

模型	一句话记住它
GPT	AI界的开创者，最出名，能力全面
Claude	写作最好，长文档最强，最像"文人"
Gemini	Google出品，搜索+AI天然融合
DeepSeek	中国造，顶尖能力，开源白嫖
Grok	马斯克的AI，最敢说话，接入X平台
LLaMA	Meta开源，撑起整个开源AI生态
豆包	字节出品，国内新手首选
文心一言	百度，最早落地的国产大模型
通义千问	阿里，开源，程序员好伙伴
Kimi	月之暗面，200万字文档处理
讯飞星火	科大讯飞，教育+语音场景强
智谱GLM	清华系，开源，学术界常用
Midjourney	最惊艳的AI绘图，艺术感最强
Stable Diffusion	开源绘图，可以本地跑
即梦	字节，中文绘图+视频创作
可灵AI	快手，真实感视频生成国内第一
Sora	OpenAI，开创视频生成新纪元

🔔 关注专栏，不错过每一次AI进化

如果这篇文章对你有帮助，欢迎 点赞 + 收藏 + 关注！
有任何想了解的AI工具，欢迎在评论区告诉我，我会优先安排文章！

本文为【AI大模型百科专栏】开篇导航 · 持续更新版
*作者：[孤岛站岗]

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

C++内存管理终极指南：从智能指针到RAII

AtomGit开源社区

LlamaFactory v0.9.5 发布：Qwen3.5/Qwen3.6/Gemma4 全面支持，Transformers v5 兼容性正式到位

代码地址：github.com/hiyouga/LlamaFactory总体来看，LlamaFactory v0.9.5 是一个覆盖面极广、工程含量很高的版本。它的重点并不只是“新增几个模型”，而是围绕这个核心目标，把模型支持、训练框架、分布式能力、多模态处理、模板配置、CI 环境、文档说明一起往前推进了一大步。Qwen3.5Qwen3.6Gemma4FSDP2DeepSpeed量化多模态v1 训