【AI大模型百科专栏】开篇:从第一个大模型到未来——一部正在书写的历史

🚀 专栏定位:这不是一个只介绍热门工具的入门帖,而是一部持续更新的AI大模型编年史
从2017年Transformer架构诞生,到GPT改变世界,到DeepSeek震惊全球,再到未来还未出现的模型——只要AI在进化,本专栏就会一直更新下去。

🎯 适合人群:AI零基础新手 / 想系统了解AI发展脉络的人 / 对某个模型感兴趣想快速入门的人


一、为什么要做这个专栏?

AI大模型的发展速度,比任何人预想的都要快。

  • 2017年,一篇论文《Attention Is All You Need》悄悄埋下了种子
  • 2022年底,ChatGPT用5天突破100万用户,改变了世界对AI的认知
  • 2025年初,DeepSeek用极低成本打出顶尖性能,震惊了整个硅谷
  • ……未来还会发生什么,没人知道

面对这场席卷一切的技术浪潮,普通人最需要的,不是看懂论文,而是:

知道有哪些工具,它们能做什么,什么时候该用哪个。

这就是这个专栏存在的意义。


二、AI大模型的"诞生时间线"

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 2017  Transformer架构诞生(Google论文),奠定现代大模型基础
 2018  BERT(Google)发布,NLP领域革命
 2018  GPT-1(OpenAI)发布,语言生成初试
 2019  GPT-2(OpenAI)发布,"太危险不敢公开"
 2020  GPT-3(OpenAI)发布,1750亿参数震惊世界
 2021  GitHub Copilot发布,AI写代码进入实用阶段
 2022  ChatGPT发布(11月),AI进入大众视野
 2022  Stable Diffusion开源,AI绘图全民化
 2022  Midjourney公测,AI绘图惊艳全球
 2023  GPT-4发布,多模态时代开启
 2023  文心一言、通义千问、讯飞星火 国产大模型集中爆发
 2023  LLaMA(Meta)开源,开源生态爆炸式增长
 2023  Claude 1/2(Anthropic)发布
 2023  Gemini(Google)发布
 2023  Kimi(月之暗面)发布
 2024  Sora(OpenAI)发布,视频生成进入新纪元
 2024  可灵AI(快手)发布,国产视频AI崛起
 2024  GPT-4o、Claude 3.5,能力大幅跃升
 2024  豆包、即梦 字节AI产品矩阵成型
 2025  DeepSeek R1/V3 震惊全球,低成本高性能
 2025  Grok 3(xAI)发布,马斯克入局
 2025  各大模型持续迭代……
 未来  ???(持续更新中)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

三、大模型的分类地图

按能力类型分

📝 文本/对话类
  ├── 国际:GPT系列、Claude、Gemini、Grok、LLaMA
  └── 国内:豆包、文心一言、通义千问、Kimi、讯飞星火、智谱GLM、DeepSeek

🎨 图像生成类
  ├── 国际:Midjourney、DALL·E、Stable Diffusion、Adobe Firefly
  └── 国内:即梦(字节)、文心一格(百度)、通义万相(阿里)

🎬 视频生成类
  ├── 国际:Sora(OpenAI)、Runway、Pika
  └── 国内:可灵AI(快手)、即梦视频(字节)、海螺AI(MiniMax)

🎵 音频/音乐生成类
  └── Suno、Udio、ElevenLabs

💻 代码专用类
  └── GitHub Copilot、Cursor、DeepSeek Coder、Qwen-Coder

按开源/闭源分

闭源(只能用API/产品):
  GPT系列、Claude、Gemini、Midjourney、可灵AI

开源(可下载部署):
  LLaMA(Meta)、Qwen/通义千问(阿里)
  DeepSeek(幻方量化)、Stable Diffusion、Mistral

按国籍分

🇺🇸 美国:OpenAI(GPT)、Anthropic(Claude)、Google(Gemini)、Meta(LLaMA)、xAI(Grok)
🇨🇳 中国:百度(文心)、字节(豆包/即梦)、阿里(通义)、快手(可灵)、
          月之暗面(Kimi)、幻方(DeepSeek)、科大讯飞(星火)、智谱(GLM)
🇫🇷 法国:Mistral AI

四、专栏文章目录(持续更新)

📚 第一章:奠基时代(2017-2021)

大模型的技术根基是怎么建立的?

篇号 文章标题 状态
A01 Transformer:改变一切的那篇论文 ✅ 已发布
A02 BERT:让机器"读懂"语言的里程碑 ✅ 已发布
A03 GPT-1/2/3:从"能写字"到"像人一样写" ✅ 已发布

📚 第二章:爆发时代(2022-2023)

ChatGPT横空出世,AI进入大众视野

篇号 文章标题 状态
B01 ChatGPT/GPT-4:AI界的"老大哥" ✅ 已发布
B02 Stable Diffusion:开源绘图,让AI绘画飞入寻常百姓家 ✅ 已发布
B03 Midjourney:最惊艳的AI绘图工具 ✅ 已发布
B04 Claude:最"懂文章"的AI ✅ 已发布
B05 LLaMA:Meta的开源大模型,撑起半个AI开源生态 ✅ 已发布
B06 文心一言:百度的AI战略,国产大模型先行者 ✅ 已发布
B07 通义千问:阿里的开源大模型 ✅ 已发布
B08 讯飞星火:科大讯飞的AI大模型 ✅ 已发布
B09 智谱GLM/ChatGLM:清华系开源大模型 ✅ 已发布
B10 Gemini:Google的AI反击战 ✅ 已发布
B11 Kimi:超长文本处理专家 ✅ 已发布

📚 第三章:群雄时代(2024)

视频、多模态、Agent全面爆发

篇号 文章标题 状态
C01 Sora:OpenAI的视频生成,通向"世界模拟器" ✅ 已发布
C02 可灵AI:一句话生成视频,国产天花板 ✅ 已发布
C03 豆包:字节出品,国内最好用的AI助手 ✅ 已发布
C04 即梦:字节的AI创意神器 ✅ 已发布
C05 GPT-4o:全能多模态,AI助手的新标杆 🔄 更新中

📚 第四章:颠覆时代(2025-)

成本革命与推理突破

篇号 文章标题 状态
D01 DeepSeek:用1/10成本打出顶尖性能,震惊硅谷 ✅ 已发布
D02 Grok:马斯克的AI,最"敢说话"的大模型 ✅ 已发布
D03 未来的模型…… 🔜 持续更新

五、怎么用这个专栏?

👶 如果你是完全新手

按顺序从 B01(GPT) 开始读,每天一篇,两周后你就能和懂行的人聊AI了。

🎯 如果你想快速找到"适合自己的工具"

直接看下面这张表:

你的需求 推荐工具
日常对话、写作(国内) 豆包 / Kimi
处理超长PDF文档 Kimi / Claude
写代码 GPT / DeepSeek
AI绘图 GPT / Midjourney / 即梦
AI视频生成 可灵AI / 即梦
开源/本地部署 LLaMA / DeepSeek
Google生态用户 Gemini
最新信息/推理任务 DeepSeek / GPT-o

🔬 如果你对AI技术本身感兴趣

第一章(奠基时代) 开始,了解大模型是怎么一步步发展到今天的。


六、关于专栏更新说明

📢 本专栏承诺

  • 每当有重大的新模型发布,第一时间更新文章
  • 每当已有模型发布重大新版本,更新对应文章
  • 所有文章面向普通人,不要求任何数学或编程基础
  • 文章永久免费,欢迎分享

七、一句话总结每个大模型

最后,送给你一张"速查名片":

模型 一句话记住它
GPT AI界的开创者,最出名,能力全面
Claude 写作最好,长文档最强,最像"文人"
Gemini Google出品,搜索+AI天然融合
DeepSeek 中国造,顶尖能力,开源白嫖
Grok 马斯克的AI,最敢说话,接入X平台
LLaMA Meta开源,撑起整个开源AI生态
豆包 字节出品,国内新手首选
文心一言 百度,最早落地的国产大模型
通义千问 阿里,开源,程序员好伙伴
Kimi 月之暗面,200万字文档处理
讯飞星火 科大讯飞,教育+语音场景强
智谱GLM 清华系,开源,学术界常用
Midjourney 最惊艳的AI绘图,艺术感最强
Stable Diffusion 开源绘图,可以本地跑
即梦 字节,中文绘图+视频创作
可灵AI 快手,真实感视频生成国内第一
Sora OpenAI,开创视频生成新纪元

🔔 关注专栏,不错过每一次AI进化

如果这篇文章对你有帮助,欢迎 点赞 + 收藏 + 关注
有任何想了解的AI工具,欢迎在评论区告诉我,我会优先安排文章!


本文为【AI大模型百科专栏】开篇导航 · 持续更新版
*作者:[孤岛站岗]

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐