Ollama云环境大模型保姆级部署教程

小菜猴

574人浏览 · 2026-03-16 09:16:34

小菜猴 · 2026-03-16 09:16:34 发布

Ollama云环境大模型保姆级部署教程

一、部署前必读（2C2G服务器专属提示）

Ollama是轻量化本地大模型运行工具，2核2G阿里云ECS（Ubuntu系统）仅支持运行1.5B及以下量化小模型，避免部署7B等大模型导致内存溢出、服务器卡死。本次教程适配纯CPU环境，无需GPU，全程命令行+Web界面双模式操作。

✅ 前置准备

阿里云ECS实例：2核2G，Ubuntu 20.04/22.04 LTS（推荐22.04），系统盘≥40G
已配置安全组：放行22端口（SSH）、11434端口（Ollama默认）、3000端口（WebUI）
本地SSH工具（Xshell、FinalShell或系统自带终端），服务器公网IP、root/普通账号密码
稳定网络：建议服务器带宽≥2M，避免模型拉取超时

2C2G服务器严禁跑7B/8B模型！优先选择deepseek-r1:1.5b、qwen2:1.5b、phi3:mini等轻量化模型，内存占用控制在1.5G以内。

这里大家也可以试试雨云云服务器，新用户可以用积分免费兑换云服务器，作为个人开发者练练手足够啦！ 雨云专属注册通道

二、服务器基础环境配置

1. SSH登录服务器

打开本地终端，输入以下命令登录（替换为你的服务器公网IP）：

ssh root@你的服务器公网IP

输入密码完成登录，建议先切换普通用户操作，避免root权限风险。

2. 更新系统依赖

执行命令更新系统包，避免依赖缺失：

sudo apt update && sudo apt upgrade -y
# 安装必备工具
sudo apt install curl ufw git -y

3. 防火墙放行端口

Ubuntu默认启用UFW防火墙，需放行Ollama和WebUI核心端口：

# 放行SSH端口（必开，防止失联）
sudo ufw allow 22/tcp
# 放行Ollama API端口
sudo ufw allow 11434/tcp
# 放行WebUI端口
sudo ufw allow 3000/tcp
# 启用防火墙并查看状态
sudo ufw enable
sudo ufw status

阿里云控制台需同步在安全组放行上述端口，否则外网无法访问！

三、Ollama 一键安装与启动

1. 官方脚本一键安装

Ollama提供Linux一键安装脚本，执行后自动配置服务、设置开机自启：

curl -fsSL https://ollama.com/install.sh | sh

安装完成后，验证版本：

ollama --version

显示版本号即安装成功，默认会启动ollama服务。

2. 配置远程访问（关键步骤）

默认Ollama仅监听本地127.0.0.1，需修改配置允许外网访问：

# 编辑Ollama服务配置
sudo systemctl edit ollama

在弹出的编辑器中，粘贴以下内容（监听所有网卡）：

[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"

按Ctrl+O保存，Ctrl+X退出，重启服务生效：

# 重新加载服务配置
sudo systemctl daemon-reload
# 重启Ollama
sudo systemctl restart ollama
# 查看服务状态（确保active running）
sudo systemctl status ollama

3. 测试Ollama服务

本地浏览器访问：http://你的服务器公网IP:11434，显示Ollama is running即远程配置成功。

四、轻量化模型拉取与运行

1. 推荐2C2G适配模型

qwen2:1.5b（通义千问轻量版，中文友好）
deepseek-r1:1.5b（代码+对话双优）
phi3:mini（微软小模型，速度极快）

2. 拉取模型命令

以通义千问1.5B为例，执行命令自动下载并加载模型：

ollama pull qwen2:1.5b

下载完成后，查看已安装模型：

ollama list

3. 命令行对话测试

ollama run qwen2:1.5b

进入对话界面后，输入问题即可交互，输入/bye退出对话。

若拉取超时，可更换国内镜像，或重启Ollama服务重试；2C2G服务器加载模型需等待1-3分钟，耐心等待勿重复操作。

五、部署WebUI界面（浏览器可视化操作）

命令行操作不够直观，部署OpenWebUI实现浏览器可视化对话，适配2C2G服务器：

1. Docker安装（WebUI依赖）

# 安装Docker
curl -fsSL https://get.docker.com | sh
# 将当前用户加入docker组（无需sudo）
sudo usermod -aG docker $USER
# 退出终端重新登录，生效权限
exit

2. 启动OpenWebUI容器

# 拉取并启动WebUI，关联Ollama服务
docker run -d \
  -p 3000:3000 \
  -e OLLAMA_BASE_URL=http://127.0.0.1:11434 \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main