项目地址:https://github.com/unslothai/unsloth


目录


1. Unsloth 是什么?

Unsloth 是一个面向本地 AI 模型“运行 + 训练”的开源项目,目标是让你以更低门槛、更高效率完成以下工作:

  1. 本地推理(Inference):下载并运行模型,做对话、代码、工具调用等。
  2. 模型训练(Training):做 SFT、RL、全量/LoRA 微调等。
  3. 统一入口:既支持图形界面(Unsloth Studio),也支持代码方式(Unsloth Core)。

官方给出的定位是:

Run and train AI models with a unified local interface.

对开发者来说,它最大的吸引力通常是:

  • 训练提速(官方描述可达 2x)
  • 更省显存(官方描述最高可到 70%)
  • 支持模型和任务范围广(文本、视觉、音频、嵌入、RL)

2. 核心能力速览

结合官方 README,Unsloth 的能力可以拆成两块。

推理能力

  • 搜索、下载并运行模型(含 GGUF、LoRA、safetensors)
  • 模型导出(GGUF、16-bit safetensors 等)
  • Tool Calling(含自动修复能力)
  • 代码执行能力(便于“边生成边验证”)
  • 支持上传图片、音频、PDF、代码、DOCX 等多种文件

训练能力

  • 覆盖 500+ 模型
  • 支持 SFT、全量训练、RL、4-bit/16-bit/FP8 等
  • 支持多 GPU(并持续增强)
  • Data Recipes:可从 PDF/CSV/DOCX 等构建训练数据
  • 训练过程可观测(loss、GPU 占用等)

3. 两种使用方式:Studio 与 Core

Unsloth 官方主推两条路线:

A) Unsloth Studio(Web UI)

  • 更适合:想快速上手、少写代码的人
  • 特点:图形界面操作,模型管理、对话、数据处理、训练流程更直观

B) Unsloth Core(代码方式)

  • 更适合:希望可编排、可脚本化、可集成 CI/CD的开发者
  • 特点:命令行 + Python 生态,适合工程化和自动化

建议:

  • 新手先从 Studio 起步
  • 稳定后再迁移 Core 做批量化与自动化

4. 安装 Unsloth Studio(Web UI)

Studio 支持 Windows、Linux、WSL、macOS(其中部分平台训练能力仍在持续补齐)。

4.1 macOS / Linux / WSL

curl -fsSL https://unsloth.ai/install.sh | sh

4.2 Windows

irm https://unsloth.ai/install.ps1 | iex

4.3 启动、更新与访问

启动:

unsloth studio -H 0.0.0.0 -p 8888

然后浏览器访问:

http://localhost:8888

更新(非 Windows):

unsloth studio update

也可以重复执行安装命令完成更新。

4.4 Docker 方式

docker run -d -e JUPYTER_PASSWORD="mypassword" \
  -p 8888:8888 -p 8000:8000 -p 2222:22 \
  -v $(pwd)/work:/workspace/work \
  --gpus all \
  unsloth/unsloth

适合场景:

  • 不想污染宿主环境
  • 团队内统一开发镜像
  • 快速迁移到新机器

5. 安装 Unsloth Core(代码方式)

5.1 Linux / WSL

curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv unsloth_env --python 3.13
source unsloth_env/bin/activate
uv pip install unsloth --torch-backend=auto

5.2 Windows

winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv  -e
uv venv unsloth_env --python 3.13
.\unsloth_env\Scripts\activate
uv pip install unsloth --torch-backend=auto

说明:Windows 下 pip install unsloth 依赖 PyTorch 安装状态,建议参考官方 Windows 安装文档。


6. 使用流程:从 0 到 1

6.1 用 Studio 体验推理对话

最短路径:

  1. 启动 unsloth studio
  2. 在模型页搜索并下载一个你想跑的模型
  3. 打开 Chat 页面开始对话
  4. 尝试上传文件(PDF/图片/代码)验证多模态输入

建议先做两个小测试:

  • 知识问答测试:看模型基础能力
  • 工具调用测试:看模型能否稳定完成“调用-返回-纠错”闭环

6.2 用 Studio 做微调训练

一个常见闭环:

  1. 准备数据(可通过 Data Recipes 从结构化/文档数据抽取)
  2. 选基座模型
  3. 选择训练方式(如 LoRA/SFT)
  4. 配置训练参数(batch、epoch、学习率等)
  5. 训练并观察 loss、GPU 利用率
  6. 导出模型(GGUF / safetensors)
  7. 回到推理页验证训练效果

如果是企业落地,建议做一个固定评测集,确保每次训练后可量化对比。

6.3 用 Core 做脚本化训练(思路)

虽然具体代码会因任务而异,但建议遵循下面结构:

  • data_pipeline.py:数据清洗、切分、格式化
  • train.py:模型加载、LoRA/训练参数、训练过程
  • eval.py:统一评测入口
  • export.py:导出与发布

好处:

  • 可复现
  • 可自动化
  • 可在团队中标准化复用

7. 常见问题与排错建议

1)安装后命令不可用

  • 先确认 shell 环境变量是否刷新
  • 重开终端再试
  • which unsloth(或 Windows 等效命令)检查路径

2)GPU 没识别/训练失败

  • 检查驱动、CUDA、PyTorch 与硬件是否匹配
  • 对照官方文档中的平台说明(NVIDIA/AMD/Intel/macOS)

3)端口冲突

  • 更换端口,比如 -p 8890
  • 确认没有旧进程占用

4)模型下载慢

  • 配置网络代理或镜像
  • 先测试小模型验证流程,再跑大模型

5)Windows 下环境复杂

  • 优先按官方 Windows 指南一步一步来
  • 有条件可先在 WSL 跑通再迁移

8. 适合什么场景?

Unsloth 特别适合以下场景:

  • 本地大模型实验与对比评测
  • 中小团队快速搭建“训练 + 推理”一体化流程
  • 个人开发者做垂直微调(客服、文档问答、代码助手)
  • 需要可视化与代码并行的 AI 工程实践

如果你是“想快、又不想被复杂环境折腾太久”的开发者,Unsloth 的上手体验会比较友好。


9. 总结

一句话总结:

Unsloth = 低门槛本地 AI 工程平台(Studio) + 可工程化扩展(Core)。

它不是只做“跑模型”,而是把“下载、对话、训练、导出、迭代”串成了完整闭环。

如果你打算在本地长期做模型实验,建议路径:

  1. 先用 Studio 跑通完整流程
  2. 再用 Core 做脚本化沉淀
  3. 最后补上评测与版本管理,进入工程化迭代

参考链接

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐