Ollama云环境大模型保姆级部署教程
Ollama云环境大模型保姆级部署教程
一、部署前必读(2C2G服务器专属提示)
Ollama是轻量化本地大模型运行工具,2核2G阿里云ECS(Ubuntu系统)仅支持运行1.5B及以下量化小模型,避免部署7B等大模型导致内存溢出、服务器卡死。本次教程适配纯CPU环境,无需GPU,全程命令行+Web界面双模式操作。
✅ 前置准备
-
阿里云ECS实例:2核2G,Ubuntu 20.04/22.04 LTS(推荐22.04),系统盘≥40G
-
已配置安全组:放行22端口(SSH)、11434端口(Ollama默认)、3000端口(WebUI)
-
本地SSH工具(Xshell、FinalShell或系统自带终端),服务器公网IP、root/普通账号密码
-
稳定网络:建议服务器带宽≥2M,避免模型拉取超时
2C2G服务器严禁跑7B/8B模型!优先选择deepseek-r1:1.5b、qwen2:1.5b、phi3:mini等轻量化模型,内存占用控制在1.5G以内。
这里大家也可以试试雨云云服务器,新用户可以用积分免费兑换云服务器,作为个人开发者练练手足够啦! 雨云专属注册通道
二、服务器基础环境配置
1. SSH登录服务器
打开本地终端,输入以下命令登录(替换为你的服务器公网IP):
ssh root@你的服务器公网IP
输入密码完成登录,建议先切换普通用户操作,避免root权限风险。
2. 更新系统依赖
执行命令更新系统包,避免依赖缺失:
sudo apt update && sudo apt upgrade -y
# 安装必备工具
sudo apt install curl ufw git -y
3. 防火墙放行端口
Ubuntu默认启用UFW防火墙,需放行Ollama和WebUI核心端口:
# 放行SSH端口(必开,防止失联)
sudo ufw allow 22/tcp
# 放行Ollama API端口
sudo ufw allow 11434/tcp
# 放行WebUI端口
sudo ufw allow 3000/tcp
# 启用防火墙并查看状态
sudo ufw enable
sudo ufw status
阿里云控制台需同步在安全组放行上述端口,否则外网无法访问!
三、Ollama 一键安装与启动
1. 官方脚本一键安装
Ollama提供Linux一键安装脚本,执行后自动配置服务、设置开机自启:
curl -fsSL https://ollama.com/install.sh | sh
安装完成后,验证版本:
ollama --version
显示版本号即安装成功,默认会启动ollama服务。
2. 配置远程访问(关键步骤)
默认Ollama仅监听本地127.0.0.1,需修改配置允许外网访问:
# 编辑Ollama服务配置
sudo systemctl edit ollama
在弹出的编辑器中,粘贴以下内容(监听所有网卡):
[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
按Ctrl+O保存,Ctrl+X退出,重启服务生效:
# 重新加载服务配置
sudo systemctl daemon-reload
# 重启Ollama
sudo systemctl restart ollama
# 查看服务状态(确保active running)
sudo systemctl status ollama
3. 测试Ollama服务
本地浏览器访问:http://你的服务器公网IP:11434,显示Ollama is running即远程配置成功。
四、轻量化模型拉取与运行
1. 推荐2C2G适配模型
-
qwen2:1.5b(通义千问轻量版,中文友好)
-
deepseek-r1:1.5b(代码+对话双优)
-
phi3:mini(微软小模型,速度极快)
2. 拉取模型命令
以通义千问1.5B为例,执行命令自动下载并加载模型:
ollama pull qwen2:1.5b
下载完成后,查看已安装模型:
ollama list
3. 命令行对话测试
ollama run qwen2:1.5b
进入对话界面后,输入问题即可交互,输入/bye退出对话。
若拉取超时,可更换国内镜像,或重启Ollama服务重试;2C2G服务器加载模型需等待1-3分钟,耐心等待勿重复操作。
五、部署WebUI界面(浏览器可视化操作)
命令行操作不够直观,部署OpenWebUI实现浏览器可视化对话,适配2C2G服务器:
1. Docker安装(WebUI依赖)
# 安装Docker
curl -fsSL https://get.docker.com | sh
# 将当前用户加入docker组(无需sudo)
sudo usermod -aG docker $USER
# 退出终端重新登录,生效权限
exit
2. 启动OpenWebUI容器
# 拉取并启动WebUI,关联Ollama服务
docker run -d \
-p 3000:3000 \
-e OLLAMA_BASE_URL=http://127.0.0.1:11434 \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:main
3. WebUI访问与使用
浏览器访问:http://你的服务器公网IP:3000,首次访问注册账号登录,即可选择已拉取的模型进行可视化对话。
六、常用运维命令(2C2G服务器优化)
-
查看Ollama日志:
journalctl -u ollama -f -
停止Ollama服务:
sudo systemctl stop ollama -
开机自启Ollama:
sudo systemctl enable ollama(默认已开启) -
删除无用模型:
ollama rm 模型名称(释放服务器空间) -
查看内存占用:
free -h(确保模型运行后剩余内存≥300M)
七、常见问题排查
1. 模型加载失败、服务器卡顿
解决方案:更换1.5B及以下小模型,关闭多余进程,重启Ollama服务;2C2G服务器仅支持单模型运行。
2. 外网无法访问Ollama/WebUI
解决方案:检查阿里云安全组端口放行、服务器UFW防火墙状态、Ollama监听地址是否为0.0.0.0。
3. 模型拉取速度慢/超时
解决方案:提升服务器带宽,或等待闲时下载;无需手动更换镜像,官方脚本已适配国内网络。
至此,阿里云2C2G Ubuntu服务器Ollama部署完成,既能用命令行快速调用,也能通过WebUI可视化使用,低成本实现私有AI大模型部署。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐




所有评论(0)