让DeepSeek住进你的电脑：一份保姆级本地部署指南

慕容卡卡

874人浏览 · 2026-03-27 21:52:36

慕容卡卡 · 2026-03-27 21:52:36 发布

让DeepSeek住进你的电脑：一份保姆级本地部署指南

嘿，朋友！今天我想跟你聊聊怎么把那个聪明又免费的DeepSeek“请”到自己电脑里。别怕麻烦，我会像跟老朋友聊天一样，一步步带你走完这个过程。

为什么要把AI“请”回家？

你可能已经习惯了打开网页就能跟DeepSeek聊天，但有些时候——比如网络卡顿、担心隐私泄露，或者纯粹想体验一下“掌控感”，你就会想把模型下载到本地。本地部署的好处是：数据完全在你手里，离线也能用，而且可以随意折腾，想让它回答多长就多长，完全不受网页版限制。当然，它也有个小门槛：你得准备好一台配置够用的电脑，以及一点点耐心。

先看看你家电脑够不够“格”

DeepSeek有很多“兄弟姐妹”，从1.5B的“小个子”到70B的“大块头”，你需要根据自己电脑的配置来选。我建议新手先从7B版本入手，它大约需要8GB显存（如果有独立显卡）或16GB内存（用CPU跑）。如果你只有一台普通的轻薄本，别灰心，可以选1.5B版本，它非常轻量，甚至能在树莓派上跑。

快速判断：

如果你有NVIDIA显卡（比如RTX 3060及以上），那太好了，GPU加速会让你飞起。
如果你只有集成显卡或者老电脑，没关系，我们用CPU模式，慢是慢点，但能跑。

两种“请神”方式，总有一款适合你

懒人福音：用Ollama一键搞定

如果你不想敲太多命令，Ollama是你的最佳拍档。它就像一个贴心的管家，帮你把所有复杂的安装、依赖、模型下载都包了。

先去Ollama官网下载对应你系统的安装包，双击安装，全程傻瓜式。
安装完成后，打开终端（Windows用CMD或PowerShell，Mac/Linux用Terminal），输入一行命令：
```
ollama run deepseek-r1:7b
```
等待它自动下载模型（大约4-5GB，喝杯咖啡的时间），然后你就可以在命令行里跟DeepSeek聊天啦！

如果想有个漂亮的图形界面，可以再装个Open WebUI，用Docker一条命令就能跑起来，之后在浏览器里访问http://localhost:3000，就像用ChatGPT一样。

动手玩家：纯手动部署

如果你喜欢自己掌控一切，或者想深入了解工作原理，可以试试手动部署。别担心，我会陪你一步步来。

第一步：准备好“工棚”

安装Python 3.10（千万不要装3.11以上，不然后面可能打架）。

用虚拟环境把DeepSeek的“家”隔离起来：

python -m venv deepseek_env
deepseek_env\Scripts\activate  # Windows
source deepseek_env/bin/activate  # Mac/Linux

第二步：安装“骨架”

安装PyTorch（如果是GPU，记得加CUDA支持）：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

再装上transformers、accelerate这些“器官”：
```
pip install transformers accelerate sentencepiece
```

第三步：把DeepSeek“请进家”

去Hugging Face找到DeepSeek的模型仓库，用git lfs下载（因为文件很大）：
```
git lfs install
git clone https://huggingface.co/deepseek-ai/deepseek-llm-7b-base D:\deepseek_model
```
下载过程可能会有点漫长，你可以趁机去泡杯茶。

第四步：写个“见面礼”

创建一个chat.py文件，内容如下（我帮你简化好了）：

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_path = "D:/deepseek_model"  # 换成你自己的路径
device = "cuda" if torch.cuda.is_available() else "cpu"

print(f"正在加载模型到{device}，请稍等...")
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto")
tokenizer = AutoTokenizer.from_pretrained(model_path)

print("加载完成！可以开始聊天啦（输入quit退出）")
while True:
    prompt = input("\n你：")
    if prompt.lower() == "quit":
        break
    inputs = tokenizer(prompt, return_tensors="pt").to(device)
    outputs = model.generate(**inputs, max_new_tokens=200)
    reply = tokenizer.decode(outputs[0], skip_special_tokens=True)
    print(f"DeepSeek：{reply}")

运行它：
```
python chat.py
```
如果一切顺利，你会看到模型开始输出，然后就能在命令行里跟DeepSeek对话啦！

可能会遇到的“小脾气”

“CUDA out of memory”：显存不够。别慌，试着把max_new_tokens改小一点，或者加上load_in_8bit=True，让模型“节食”一下。

“No module named…”：多半是依赖没装全，用pip install -r requirements.txt补上。

模型半天不响应：可能你的电脑在“喘气”，尤其是CPU模式，耐心等一等就好。

写在最后

把DeepSeek装进自己的电脑，就像在房间里养了一只聪明的宠物——你可以随时跟它聊天，不用担心网络断了，也不用担心隐私泄露。虽然部署过程可能会遇到一些小波折，但当你第一次看到它在本地终端里“开口说话”时，那种成就感是无可替代的。

如果你实在不想折腾，或者电脑配置有限，那也没关系，官方网页版（chat.deepseek.com）永远为你敞开怀抱。毕竟，让AI服务于你，才是最重要的，不是吗？

现在，快去试试吧！如果遇到问题，欢迎随时回来找我聊聊。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

AI编程SubAgent模板大全（适配Spec驱动开发场景）

本文提供了一套完整的AI编程SubAgent模板大全，专为Spec驱动开发场景设计。包含12个标准化YAML模板，覆盖从需求评审到上线运维的全流程开发环节。核心特点：严格遵循Spec驱动开发的递进逻辑（原型→产品Spec→开发Spec）包含需求评审、需求转代码、开发设计、设计评审等关键阶段模板每个模板明确分工边界，强化特定能力（如需求评审SubAgent具备原型解析、风险预判等5大核心能力