这个叫做MiniMind轻量级免费开源的项目,仅用3元成本即可训练出仅为25.8M的超小语言模型库,在github上已获得38.4k星标。

MiniMind系列极其轻量,最小版本体积是 GPT-3 的 1/7000,力求做到最普通的个人GPU也可快速训练,这不仅是大语言模型的全阶段开源复现,也是一个入门LLM的教程

图片

🔥项目信息

项目名称:MiniMind

GitHub 链接:https://github.com/jingyaogong/minimind

社区认可度:⭐38.4k+Star

图片

🚀仓库介绍

MiniMind项目开源了覆盖大模型全生命周期的完整代码体系,包括拓展共享混合专家(MoE)架构、数据集清洗、预训练(Pretrain)、监督微调(SFT)、LoRA 微调、直接偏好优化(DPO)、强化学习训练(RLAIF:PPO/GRPO 等)以及模型蒸馏等全流程环节;同时还拓展出视觉多模态版本 MiniMind-V,进一步丰富了应用场景。

图片

值得一提的是,项目所有核心算法代码均基于 PyTorch 从零原生重构,完全不依赖第三方库的抽象接口,开发者可深度拆解每一行代码逻辑。这不仅是对大语言模型全阶段技术的开源复现,更是一套面向普通开发者的 LLM 入门教程,期望以低成本、易上手的实践范例抛砖引玉,让更多人体验构建 AI 模型的乐趣,推动 AI 社区的普惠与进步

主要模型版本:

图片

🚀部署方式

下载代码:

git clone https://github.com/jingyaogong/minimind.git

代码结构:

minimind/├── model/          # 模型核心代码(MoE/LoRA/MiniMind主模型)├── dataset/        # 数据集及处理代码├── trainer/        # 训练器(预训练/SFT/DPO/RLAIF等)├── scripts/        # 部署脚本(OpenAI API/ WebUI/模型转换)├── eval_llm.py     # 模型测评└── requirements.txt # 依赖清单

测试已有模型效果

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple

提前测试Torch是否可用cuda

import torchprint(torch.cuda.is_available())

从下文提供的数据集下载链接 下载需要的数据文件(创建./dataset目录)并放到./dataset下

开始训练:

python train_pretrain.py

微调:

python train_full_sft.py

所有训练脚本均为Pytorch原生框架,均支持多卡加速,假设你的设备有N (N>1) 张显卡

🚀适用场景

  • LLM 入门学习:通过原生代码理解大模型底层原理(无封装黑盒);
  • 低成本定制模型:快速适配私有数据集(如医疗、自我认知等场景);
  • 轻量级部署:边缘设备 / 低显存 GPU 下的小模型应用开发。

这里给大家精心整理了一份全面的AI大模型学习资源包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

👇👇扫码免费领取全部内容👇👇
在这里插入图片描述

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 2026行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

7. 资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇
在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐