Ollama云环境大模型保姆级部署教程

一、部署前必读(2C2G服务器专属提示)

Ollama是轻量化本地大模型运行工具,2核2G阿里云ECS(Ubuntu系统)仅支持运行1.5B及以下量化小模型,避免部署7B等大模型导致内存溢出、服务器卡死。本次教程适配纯CPU环境,无需GPU,全程命令行+Web界面双模式操作。

✅ 前置准备

  • 阿里云ECS实例:2核2G,Ubuntu 20.04/22.04 LTS(推荐22.04),系统盘≥40G

  • 已配置安全组:放行22端口(SSH)、11434端口(Ollama默认)、3000端口(WebUI)

  • 本地SSH工具(Xshell、FinalShell或系统自带终端),服务器公网IP、root/普通账号密码

  • 稳定网络:建议服务器带宽≥2M,避免模型拉取超时

2C2G服务器严禁跑7B/8B模型!优先选择deepseek-r1:1.5b、qwen2:1.5b、phi3:mini等轻量化模型,内存占用控制在1.5G以内。

这里大家也可以试试雨云云服务器,新用户可以用积分免费兑换云服务器,作为个人开发者练练手足够啦! 雨云专属注册通道

二、服务器基础环境配置

1. SSH登录服务器

打开本地终端,输入以下命令登录(替换为你的服务器公网IP):

ssh root@你的服务器公网IP

输入密码完成登录,建议先切换普通用户操作,避免root权限风险。

2. 更新系统依赖

执行命令更新系统包,避免依赖缺失:

sudo apt update && sudo apt upgrade -y
# 安装必备工具
sudo apt install curl ufw git -y

3. 防火墙放行端口

Ubuntu默认启用UFW防火墙,需放行Ollama和WebUI核心端口:

# 放行SSH端口(必开,防止失联)
sudo ufw allow 22/tcp
# 放行Ollama API端口
sudo ufw allow 11434/tcp
# 放行WebUI端口
sudo ufw allow 3000/tcp
# 启用防火墙并查看状态
sudo ufw enable
sudo ufw status

阿里云控制台需同步在安全组放行上述端口,否则外网无法访问!

三、Ollama 一键安装与启动

1. 官方脚本一键安装

Ollama提供Linux一键安装脚本,执行后自动配置服务、设置开机自启:

curl -fsSL https://ollama.com/install.sh | sh

安装完成后,验证版本:

ollama --version

显示版本号即安装成功,默认会启动ollama服务。

2. 配置远程访问(关键步骤)

默认Ollama仅监听本地127.0.0.1,需修改配置允许外网访问:

# 编辑Ollama服务配置
sudo systemctl edit ollama

在弹出的编辑器中,粘贴以下内容(监听所有网卡):

[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"

Ctrl+O保存,Ctrl+X退出,重启服务生效:

# 重新加载服务配置
sudo systemctl daemon-reload
# 重启Ollama
sudo systemctl restart ollama
# 查看服务状态(确保active running)
sudo systemctl status ollama

3. 测试Ollama服务

本地浏览器访问:http://你的服务器公网IP:11434,显示Ollama is running即远程配置成功。

四、轻量化模型拉取与运行

1. 推荐2C2G适配模型

  • qwen2:1.5b(通义千问轻量版,中文友好)

  • deepseek-r1:1.5b(代码+对话双优)

  • phi3:mini(微软小模型,速度极快)

2. 拉取模型命令

以通义千问1.5B为例,执行命令自动下载并加载模型:

ollama pull qwen2:1.5b

下载完成后,查看已安装模型:

ollama list

3. 命令行对话测试

ollama run qwen2:1.5b

进入对话界面后,输入问题即可交互,输入/bye退出对话。

若拉取超时,可更换国内镜像,或重启Ollama服务重试;2C2G服务器加载模型需等待1-3分钟,耐心等待勿重复操作。

五、部署WebUI界面(浏览器可视化操作)

命令行操作不够直观,部署OpenWebUI实现浏览器可视化对话,适配2C2G服务器:

1. Docker安装(WebUI依赖)

# 安装Docker
curl -fsSL https://get.docker.com | sh
# 将当前用户加入docker组(无需sudo)
sudo usermod -aG docker $USER
# 退出终端重新登录,生效权限
exit

2. 启动OpenWebUI容器

# 拉取并启动WebUI,关联Ollama服务
docker run -d \
  -p 3000:3000 \
  -e OLLAMA_BASE_URL=http://127.0.0.1:11434 \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

3. WebUI访问与使用

浏览器访问:http://你的服务器公网IP:3000,首次访问注册账号登录,即可选择已拉取的模型进行可视化对话。

六、常用运维命令(2C2G服务器优化)

  • 查看Ollama日志:journalctl -u ollama -f

  • 停止Ollama服务:sudo systemctl stop ollama

  • 开机自启Ollama:sudo systemctl enable ollama(默认已开启)

  • 删除无用模型:ollama rm 模型名称(释放服务器空间)

  • 查看内存占用:free -h(确保模型运行后剩余内存≥300M)

七、常见问题排查

1. 模型加载失败、服务器卡顿

解决方案:更换1.5B及以下小模型,关闭多余进程,重启Ollama服务;2C2G服务器仅支持单模型运行。

2. 外网无法访问Ollama/WebUI

解决方案:检查阿里云安全组端口放行、服务器UFW防火墙状态、Ollama监听地址是否为0.0.0.0。

3. 模型拉取速度慢/超时

解决方案:提升服务器带宽,或等待闲时下载;无需手动更换镜像,官方脚本已适配国内网络。

至此,阿里云2C2G Ubuntu服务器Ollama部署完成,既能用命令行快速调用,也能通过WebUI可视化使用,低成本实现私有AI大模型部署。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐