> 🚀 手把手教你本地部署 DeepSeek R1,无需联网,保护隐私,支持 GPU/CPU 推理!

## 前言

DeepSeek R1 是 DeepSeek 推出的开源推理模型,在数学、代码、逻辑推理等任务上表现出色。本文将详细介绍如何在本地部署 DeepSeek R1,让你拥有自己的私人 AI 助手。

## 一、环境要求

### 硬件配置

| 配置项 | 最低要求 | 推荐配置 |

|--------|----------|----------|

| CPU | 8核 | 16核+ |

| 内存 | 16GB | 32GB+ |

| 显存 | 8GB (7B模型) | 24GB+ (70B模型) |

| 硬盘 | 50GB SSD | 100GB+ SSD |

### 软件环境

- 操作系统:Ubuntu 22.04 / Windows 10+ / macOS

- Python:3.10+

- CUDA:11.8+(NVIDIA 显卡)

- Git:最新版本

## 二、安装 Ollama(推荐方式)

Ollama 是最简单的本地大模型部署工具,一行命令即可运行。

### 2.1 Linux/macOS 安装

```bash

curl -fsSL https://ollama.ai/install.sh | sh

```

### 2.2 Windows 安装

访问 [Ollama 官网](https://ollama.ai) 下载 Windows 安装包,双击安装即可。

### 2.3 验证安装

```bash

ollama --version

# 输出:ollama version 0.x.x

```

## 三、下载并运行 DeepSeek R1

### 3.1 拉取模型

根据你的显存选择合适的模型版本:

```bash

# 7B 版本(适合 8GB 显存)

ollama pull deepseek-r1:7b

# 14B 版本(适合 16GB 显存)

ollama pull deepseek-r1:14b

# 70B 版本(适合 48GB+ 显存)

ollama pull deepseek-r1:70b

```

### 3.2 运行模型

```bash

ollama run deepseek-r1:7b

```

运行后即可在终端与 DeepSeek R1 对话:

```

>>> 你好,请介绍一下你自己

<thinking>

用户要求我介绍自己。我应该说明我是DeepSeek R1,一个AI助手。

</thinking>

你好!我是 DeepSeek R1,一个由 DeepSeek 开发的AI助手。我可以帮助你:

- 回答各种问题

- 编写和调试代码

- 数学计算和逻辑推理

- 文本创作和翻译

有什么我可以帮助你的吗?

```

### 3.3 常用命令

```bash

# 查看已下载的模型

ollama list

# 删除模型

ollama rm deepseek-r1:7b

# 查看模型信息

ollama show deepseek-r1:7b

# 停止运行中的模型

ollama stop deepseek-r1:7b

```

## 四、使用 Python 调用

### 4.1 安装依赖

```bash

pip install ollama

```

### 4.2 基础调用

```python

import ollama

# 简单对话

response = ollama.chat(

    model='deepseek-r1:7b',

    messages=[

        {

            'role': 'user',

            'content': '用Python写一个快速排序算法'

        }

    ]

)

print(response['message']['content'])

```

### 4.3 流式输出

```python

import ollama

stream = ollama.chat(

    model='deepseek-r1:7b',

    messages=[

        {

            'role': 'user',

            'content': '解释什么是机器学习'

        }

    ],

    stream=True

)

for chunk in stream:

    print(chunk['message']['content'], end='', flush=True)

```

### 4.4 多轮对话

```python

import ollama

# 维护对话历史

messages = [

    {

        'role': 'system',

        'content': '你是一个专业的Python开发助手'

    }

]

def chat(user_input):

    messages.append({'role': 'user', 'content': user_input})

    response = ollama.chat(

        model='deepseek-r1:7b',

        messages=messages

    )

    assistant_message = response['message']['content']

    messages.append({'role': 'assistant', 'content': assistant_message})

    return assistant_message

# 使用示例

print(chat("什么是装饰器?"))

print(chat("给我一个装饰器的实战例子"))

```

## 五、搭建 Web UI

### 5.1 安装 Open WebUI

```bash

# 使用 Docker 安装(推荐)

docker run -d -p 3000:8080 \

  --add-host=host.docker.internal:host-gateway \

  -v open-webui:/app/backend/data \

  --name open-webui \

  --restart always \

  ghcr.io/open-webui/open-webui:main

```

### 5.2 访问界面

打开浏览器访问:`http://localhost:3000`

首次访问需要注册账号,之后即可在界面中选择 DeepSeek R1 模型进行对话。

## 六、性能优化技巧

### 6.1 使用量化模型

Ollama 默认使用 Q4_0 量化,如需更高精度:

```bash

# 使用 Q8_0 量化(精度更高,显存需求更大)

ollama pull deepseek-r1:7b-q8_0

```

### 6.2 调整推理参数

```python

response = ollama.chat(

    model='deepseek-r1:7b',

    messages=[{'role': 'user', 'content': '你好'}],

    options={

        'temperature': 0.7,      # 温度(0-1),越低越确定

        'top_p': 0.9,           # 核采样

        'num_ctx': 4096,        # 上下文长度

        'num_gpu': 999,         # GPU 层数

        'num_thread': 8         # CPU 线程数

    }

)

```

### 6.3 显存不足的解决方案

1. **使用更小的模型**:7B → 1.5B

2. **增加量化级别**:Q4_0 → Q2_K

3. **使用 CPU 推理**:设置 `CUDA_VISIBLE_DEVICES=""`

## 七、常见问题

### Q1: 模型下载很慢怎么办?

```bash

# 设置国内镜像(如果有)

export OLLAMA_HOST=0.0.0.0

# 或使用代理

export https_proxy=http://your-proxy:port

```

### Q2: 运行时报错 CUDA out of memory

- 减小 `num_ctx` 上下文长度

- 使用更小的模型版本

- 关闭其他占用显存的程序

### Q3: 如何让局域网其他设备访问?

```bash

# 设置 Ollama 监听所有网络

OLLAMA_HOST=0.0.0.0 ollama serve

```

## 八、总结

| 部署方式 | 难度 | 适用场景 |

|----------|------|----------|

| Ollama | ⭐ | 新手入门、快速体验 |

| vLLM | ⭐⭐⭐ | 生产环境、高并发 |

| llama.cpp | ⭐⭐ | 嵌入式、低资源设备 |

本文推荐使用 Ollama 方式部署,简单快速,5分钟即可拥有自己的 AI 助手!

---

**相关资源**:

- [DeepSeek 官方文档](https://deepseek.com)

- [Ollama GitHub](https://github.com/ollama/ollama)

- [Open WebUI](https://github.com/open-webui/open-webui)

---

> 📝 作者:AI技术爱好者

> 📅 更新时间:2025年

> 🔖 标签:#DeepSeek #本地部署 #AI #大模型 #Ollama

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐