树莓派完整安装 Ollama 并运行 Qwen3.5:0.8B 教程

雾削木

1527人浏览 · 2026-03-10 21:18:42

雾削木 · 2026-03-10 21:18:42 发布

本文针对树莓派（ARM64 架构）环境，解决 Ollama 安装过程中常见的「空间不足」「权限错误」「服务启动失败」等问题，提供从环境准备到模型运行的一站式教程。

一、环境检查

1. 检查磁盘与内存

首先确认树莓派磁盘空间和内存状态（需至少 10GB 可用磁盘空间、2GB 以上内存）：

bash

运行

# 查看磁盘使用情况（根分区 / 需剩余 ≥10GB）
df -h

# 查看内存和 swap 状态
free -h

2. 扩容 Swap 空间（解决解压大文件内存不足）

树莓派默认 Swap 过小，解压 Ollama 安装包会触发「空间不足」错误，需临时扩容：

bash

运行

# 1. 安装 swap 管理工具（若未安装）
sudo apt update && sudo apt install -y dphys-swapfile

# 2. 创建/修改 swap 配置文件
sudo nano /etc/dphys-swapfile

粘贴以下内容（设置 4GB Swap）：

ini

CONF_SWAPFILE=/var/swap
CONF_SWAPSIZE=4096
CONF_MAXSWAP=4096

保存退出（Ctrl+O → 回车 → Ctrl+X），然后重启 Swap：

bash

运行

sudo dphys-swapfile swapoff
sudo dphys-swapfile setup
sudo dphys-swapfile swapon

# 验证 Swap 生效（显示 SIZE 为 4G 即成功）
sudo swapon --show

二、手动安装 Ollama（绕过 /tmp 临时目录限制）

官方安装脚本会将文件下载到内存型 /tmp 目录，易触发空间不足，因此手动安装：

1. 下载 Ollama 安装包

bash

运行

# 切换到用户目录（物理磁盘，空间充足）
cd /home/$(whoami)

# 下载 ARM64 版本安装包（通过 gh-proxy 加速）
wget https://gh-proxy.org/https://github.com/ollama/ollama/releases/latest/download/ollama-linux-arm64.tar.zst -O ollama-linux-arm64.tar.zst

2. 解压并安装

bash

运行

# 创建临时解压目录
mkdir -p ~/ollama_temp

# 解压 zst 压缩包（指定 zstd 算法，避免 tar 解析错误）
sudo tar -I zstd -xf ollama-linux-arm64.tar.zst -C ~/ollama_temp

# 复制到系统目录（Ollama 安装路径）
sudo cp -r ~/ollama_temp/* /usr/local/

# 清理临时文件
rm -rf ~/ollama_temp
rm ollama-linux-arm64.tar.zst

3. 配置系统服务

bash

运行

# 创建 ollama 用户（系统级，无登录权限）
sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama

# 创建系统服务文件
sudo tee /etc/systemd/system/ollama.service > /dev/null << EOF
[Unit]
Description=Ollama Service
After=network-online.target

[Service]
User=ollama
Group=ollama
ExecStart=/usr/local/bin/ollama serve
Restart=always
RestartSec=3
Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin"

[Install]
WantedBy=multi-user.target
EOF

# 重新加载服务配置
sudo systemctl daemon-reload

# 启动并设置开机自启
sudo systemctl start ollama
sudo systemctl enable ollama

4. 修复执行权限

解决普通用户运行 ollama 提示「Permission denied」问题：

bash

运行

# 赋予全局执行权限
sudo chmod +x /usr/local/bin/ollama

# 验证权限（输出包含 rwxr-xr-x 即成功）
ls -l /usr/local/bin/ollama

5. 验证 Ollama 安装

bash

运行

# 查看版本（无「could not connect」警告即成功）
ollama --version

# 查看服务状态（显示 active (running) 即正常）
sudo systemctl status ollama

三、运行 Qwen3.5:0.8B 轻量模型

Qwen3.5:0.8B 是适配树莓派的超轻量模型，无需外接显卡即可运行：

1. 拉取并运行模型

bash

运行

# 首次运行自动下载模型（约几百 MB，耐心等待）
ollama run qwen3.5:0.8b

2. 模型交互测试

模型加载完成后，输入指令测试：

plaintext

>>> 你好，请介绍一下自己
>>> 用 Python 写一个简单的 Hello World 程序
>>> 1+1等于多少

退出交互模式：输入 /bye 并回车。

3. 模型管理（可选）

bash

运行

# 仅拉取模型（不运行）
ollama pull qwen3.5:0.8b

# 查看已安装的模型
ollama list

# 删除模型（清理空间）
ollama rm qwen3.5:0.8b

四、常见问题修复

1. 模型下载提示「空间不足」

将模型存储目录迁移到外接存储（如 U 盘 / 移动硬盘）：

bash

运行

# 停止 Ollama 服务
sudo systemctl stop ollama

# 挂载外接存储（假设设备为 /dev/sda1，挂载到 /mnt/ollama）
sudo mkdir -p /mnt/ollama/models
sudo mount /dev/sda1 /mnt/ollama
sudo chown -R ollama:ollama /mnt/ollama

# 修改模型存储路径
sudo tee /etc/systemd/system/ollama.service.d/override.conf > /dev/null << EOF
[Service]
Environment="OLLAMA_MODELS=/mnt/ollama/models"
EOF

# 重启服务
sudo systemctl daemon-reload
sudo systemctl start ollama

2. 运行模型提示「内存不足」

使用更低量化版本的模型，减少内存占用：

bash

运行

ollama run qwen3.5:0.8b-q4_0  # 4位量化版本，内存占用更低

3. 服务启动提示「端口被占用」

Ollama 默认占用 11434 端口，结束占用进程后重启：

bash

运行

# 查找并结束占用进程
sudo kill $(sudo lsof -t -i :11434)

# 重启 Ollama 服务
sudo systemctl restart ollama

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【Java SE】多线程（二）：线程安全、synchronized、volatile与wait/notify详解

AtomGit开源社区

DeepSeek V4 Flash 高效应用与场景落地指南

AtomGit开源社区

深度解析AI Agent Harness工程的六大核心组件

术语定义AI Agent具备自主感知、推理、决策、行动能力的人工智能实体，核心是Thought-Action-Observation（思考-行动-观察）的循环执行逻辑LLM生成符合特定格式的工具调用请求，由外部系统执行工具并返回结果给LLM的能力DAG（有向无环图）用来表示任务之间的依赖关系，没有循环路径的图结构，是任务调度的核心数据结构Guardrail（护栏）用来约束Agent行为的安全规则，