过去一年,本地大模型的热度持续升温。

越来越多开发者开始尝试把 AI 模型部署到自己的电脑上,不再完全依赖云端服务。

但刚接触本地 AI 时,很多人都会遇到同样的问题:

  • Ollama 是什么?
  • LM Studio 又是什么?
  • Llama 是工具还是模型?
  • MLX 和 Ollama 有什么区别?
  • Mac 用户到底该选哪个?

网上资料很多,但往往混杂着各种概念。

本文尝试从实际使用角度出发,梳理目前最常见的几种本地大模型方案,并通过安装教程和实操体验,帮助大家快速找到适合自己的选择。


一、本地大模型生态到底是什么?

很多新手容易把工具和模型混为一谈。

实际上它们属于不同层级。

简单理解:

模型(Llama、Qwen、DeepSeek)
        ↓
推理框架(Ollama、MLX)
        ↓
图形界面(LM Studio)

其中:

  • Llama 是模型
  • DeepSeek 是模型
  • Qwen 是模型

而:

  • Ollama 是模型运行平台
  • MLX 是 Apple 推出的推理框架
  • LM Studio 是桌面客户端

在这里插入图片描述


二、Llama:一切的起点

如果说本地大模型生态有一个重要转折点,

很多人会想到 Meta 发布的 Llama 系列模型。

什么是 Llama?

Llama 是 Meta 开源的大语言模型系列。

从最早的:

  • Llama 1
  • Llama 2

到现在:

  • Llama 3
  • Llama 3.1
  • Llama 3.3

已经成为许多本地 AI 应用的基础模型。


Llama 的特点

优点:

  • 社区生态成熟
  • 兼容工具多
  • 推理速度快
  • 支持 GGUF 格式

不足:

  • 中文能力一般
  • 编程能力不如 DeepSeek

因此很多国内用户更喜欢:

  • DeepSeek-R1
  • Qwen3

作为主要模型。


三、Ollama:目前最流行的本地模型运行工具

对于大多数用户来说,

Ollama 几乎是进入本地 AI 世界的第一站。


在这里插入图片描述


Ollama 是什么?

Ollama 可以理解成:

Docker for LLM

它把复杂的模型部署过程简化成一条命令。

例如:

ollama pull qwen3:8b

即可完成模型下载。


安装 Ollama

Windows

下载安装包后完成安装。

验证:

ollama --version

下载模型

Qwen:

ollama pull qwen3:8b

DeepSeek:

ollama pull deepseek-r1:8b

Llama:

ollama pull llama3.3

优势

  • 安装简单
  • 社区活跃
  • 支持大量模型
  • API兼容性好

适合:

  • 开发者
  • 本地 AI 玩家
  • Agent 用户

四、LM Studio:最适合新手的图形化方案

如果你不喜欢命令行,

LM Studio 可能是最舒服的选择。


外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


LM Studio 是什么?

LM Studio 是一个桌面应用。

它提供:

  • 模型搜索
  • 模型下载
  • 模型运行
  • 对话界面

全部通过图形化操作完成。


使用流程

第一步:

下载并安装 LM Studio

第二步:

搜索模型

例如:

Qwen3
DeepSeek
Llama

第三步:

点击 Download

第四步:

加载模型

即可开始聊天。


优势

  • 零门槛
  • 无需命令行
  • 界面友好

不足:

  • 占用资源较高
  • 自动化能力较弱

五、MLX:Mac 用户的新选择

如果你使用的是:

  • M1
  • M2
  • M3
  • M4

那么一定会看到 MLX 这个名字。


在这里插入图片描述


MLX 是什么?

MLX 是 Apple 推出的机器学习框架。

核心目标:

充分利用 Apple Silicon。


为什么 MLX 会火?

因为它能直接调用:

  • CPU
  • GPU
  • Unified Memory

实现更高效率的推理。

同样一个模型,

在部分 Mac 设备上,

MLX 往往比传统方案更流畅。


安装

pip install mlx

运行:

python -m mlx_lm.generate

即可测试模型。


六、横向对比:到底该怎么选?


在这里插入图片描述


项目 Ollama LM Studio MLX Llama
类型 推理平台 桌面客户端 推理框架 模型
新手友好 ★★★★★ ★★★★★ ★★★ ★★
自动化 ★★★★★ ★★ ★★★★
Mac优化 ★★★ ★★★ ★★★★★
Windows支持 ★★★★★ ★★★★★
API调用 ★★★★★ ★★ ★★★★

七、实操体验

下面以 DeepSeek-R1 为例。


使用 Ollama

ollama run deepseek-r1:8b

输入:

写一个Python快速排序

即可获得结果。


使用 LM Studio

启动模型后直接输入:

解释这段代码

即可获得回答。


使用 MLX

mlx_lm.generate

加载模型后进行推理。


在这里插入图片描述


八、总结

如果你刚接触本地大模型:

推荐:

LM Studio

如果你希望:

  • 调用 API
  • 搭建 Agent
  • 自动化开发

推荐:

Ollama

如果你使用:

Mac M系列芯片

推荐:

MLX

而 Llama 则更适合作为模型本身来使用。

从目前的发展趋势来看,

Ollama + DeepSeek/Qwen,

以及 MLX + DeepSeek/Qwen,

已经成为许多开发者搭建本地 AI 环境的主流组合。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐