前言

2026 年 4 月,国内 Docker 镜像加速源大面积失效的问题仍在持续。对于 Kubernetes 用户来说,这个问题比 Docker 用户更棘手——因为 containerd 的配置方式和 Docker 完全不同,网上大量 Docker 教程搬过来根本不生效。

本文基于 2026 年 4 月中旬的实测环境,整理了 5 种 containerd 镜像加速方案,并提供完整的 K8s 集群批量配置脚本。

一、为什么 containerd 的配置和 Docker 不一样?

K8s 自 1.24 版本起默认使用 containerd 作为容器运行时,弃用了 Docker Engine。但很多运维人员还在用 Docker 的思路去配置镜像加速,导致各种问题。

核心差异对比:

对比项 Docker containerd
配置文件 /etc/docker/daemon.json /etc/containerd/config.toml
镜像加速配置方式 registry-mirrors 字段 plugins."io.containerd.grpc.v1.cri".registry.mirrors
重启命令 systemctl restart docker systemctl restart containerd
拉取镜像命令 docker pull nginx:latest ctr -n k8s.io images pull docker.io/library/nginx:latest

最重要的区别:命名空间

containerd 使用命名空间隔离镜像,K8s 使用的命名空间是 k8s.io。如果你直接执行 ctr images pull,镜像拉取到了 default 命名空间,K8s 是看不到的。

# ❌ 错误:拉到默认命名空间,K8s 看不到
ctr images pull docker.io/library/nginx:alpine

# ✅ 正确:指定 k8s.io 命名空间
ctr -n k8s.io images pull docker.io/library/nginx:alpine

二、问题背景

截至 2026 年 4 月,国内从官方 registry 拉取镜像面临三大痛点:

  1. 速度慢: 直连 registry.k8s.iodocker.io,平均速度常低于 100 KB/s
  2. 频繁超时: TLS handshake timeout、i/o timeout 是家常便饭
  3. 限流: 429 Too Many Requests 错误在 CI/CD 场景中高发

大型 AI 镜像(如 pytorch/pytorch 8GB+)在直连情况下基本无法拉取成功。

三、5 种加速方案详解

3.1 方案一:直接修改 containerd 配置(适用场景:小规模集群)

/etc/containerd/config.toml 中配置 registry mirrors,将 docker.ioregistry.k8s.io 重定向到加速源。

# /etc/containerd/config.toml
version = 2

[plugins]
  [plugins."io.containerd.grpc.v1.cri"]
    [plugins."io.containerd.grpc.v1.cri".registry]
      [plugins."io.containerd.grpc.v1.cri".registry.configs]
        [plugins."io.containerd.grpc.v1.cri".registry.configs."加速源地址".tls]
          insecure_skip_verify = true
      [plugins."io.containerd.grpc.v1.cri".registry.mirrors]
        [plugins."io.containerd.grpc.v1.cri".registry.mirrors."docker.io"]
          endpoint = ["https://加速源地址"]
        [plugins."io.containerd.grpc.v1.cri".registry.mirrors."registry.k8s.io"]
          endpoint = ["https://加速源地址/k8s"]

配置完成后重启并验证:

systemctl daemon-reload
systemctl restart containerd
ctr -n k8s.io images pull docker.io/library/nginx:alpine

优点: 配置直接生效,对 K8s 上层完全透明
缺点: 每个 Node 需要单独配置;免费加速源频繁失效

3.2 方案二:自建 Registry 代理(适用场景:企业内网、生产集群)

部署一个 Docker Registry 作为缓存代理,所有 Node 从内网仓库拉取镜像。

# 部署代理 registry
docker run -d -p 5000:5000 \
  -e REGISTRY_PROXY_REMOTEURL=https://registry-1.docker.io \
  -v /data/registry:/var/lib/registry \
  --name registry-proxy \
  --restart=always \
  registry:2

然后将 containerd 的 mirrors 指向内网地址:

[plugins."io.containerd.grpc.v1.cri".registry.mirrors]
  [plugins."io.containerd.grpc.v1.cri".registry.mirrors."docker.io"]
    endpoint = ["http://内网IP:5000"]

优点: 镜像首次拉取后自动缓存,后续拉取极快
缺点: 需要额外维护服务器;首次从源站拉取仍然慢

3.3 方案三:Cloudflare Worker 反代(适用场景:个人/小团队)

// CF Worker 代码
export default {
  async fetch(request) {
    const url = new URL(request.url);
    const registry = 'https://registry-1.docker.io';
    const target = registry + url.pathname + url.search;
    return fetch(new Request(target, {
      method: request.method,
      headers: request.headers
    }));
  }
};

优点: 利用 Cloudflare 全球 CDN 节点加速
缺点: 2026 年 CF 对大文件传输限制更严;超过 100MB 的镜像层经常中断

3.4 方案四:国内第三方加速服务(适用场景:快速解决问题)

2026 年 4 月实测可用的服务对比:

服务 速度 稳定性 K8s/containerd 支持 备注
毫秒镜像 10-20 MB/s ✅ 支持 注册即用
DaoCloud 5-10 MB/s ⚠️ 部分支持 老牌但近期不稳定
百度云加速 3-8 MB/s ❌ 仅支持 Docker 限速明显

containerd 配置方法:

[plugins."io.containerd.grpc.v1.cri".registry.mirrors]
  [plugins."io.containerd.grpc.v1.cri".registry.mirrors."docker.io"]
    endpoint = ["https://加速服务地址"]
  [plugins."io.containerd.grpc.v1.cri".registry.mirrors."registry.k8s.io"]
    endpoint = ["https://加速服务地址/k8s"]

优点: 配置简单、速度快、稳定性高
缺点: 部分服务需注册、免费额度有限

3.5 方案五:nerdctl 预拉取 + 私有仓库(适用场景:CI/CD 自动化)

# 安装 nerdctl(containerd 的 Docker 兼容 CLI)
curl -sSLO https://github.com/containerd/nerdctl/releases/download/v2.0.2/nerdctl-2.0.2-linux-amd64.tar.gz
tar -xzf nerdctl-2.0.2-linux-amd64.tar.gz
mv nerdctl /usr/local/bin/

# 从加速源拉取到 k8s.io 命名空间
nerdctl pull --namespace k8s.io 加速源地址/library/nginx:alpine

# 重新 tag 并推送到私有仓库
nerdctl tag --namespace k8s.io 加速源地址/library/nginx:alpine nginx:alpine
nerdctl push --namespace k8s.io nginx:alpine 私有仓库地址/nginx:alpine

优点: 精确控制镜像版本,适合集成到 CI/CD pipeline
缺点: 需要维护自动化脚本

四、实测数据

测试环境: 腾讯云轻量应用服务器 2C4G,安徽节点

测试一:拉取 nginx:latest(约 190MB)

方案 下载速度 总耗时 成功率 配置难度
直连 Docker Hub 50-200 KB/s 15-30 分钟 30% 无需配置
自建 Registry 代理 5-15 MB/s 15-30 秒 85% 中等
CF Worker 反代 2-8 MB/s 30-90 秒 60% 较高
国内加速服务 10-20 MB/s 10-20 秒 95% 简单
nerdctl 预拉取 取决于源 - 90% 中等

测试二:拉取 pytorch/pytorch:2.2.0-cuda12.1-cudnn8-runtime(约 8GB,AI 训练场景)

方案 下载速度 总耗时 备注
直连 Docker Hub - 失败 多次超时
国内加速服务 12-18 MB/s 8-12 分钟 唯一稳定方案
自建 Registry(首次) 5-10 MB/s 13-27 分钟 首次慢,后续走缓存
CF Worker - 失败 大文件传输中断

五、K8s 集群批量配置方案

5.1 Shell 脚本(适合 5 台以内的集群)

#!/bin/bash
# K8s containerd 镜像加速一键配置脚本
# 使用方法:将 MIRROR_URL 替换为你的加速源地址,在每台 Node 上执行

set -e

MIRROR_URL="替换为你的加速源地址"

# 备份原配置
cp /etc/containerd/config.toml \
  /etc/containerd/config.toml.bak.$(date +%Y%m%d)

# 重新生成默认配置
containerd config default > /etc/containerd/config.toml

# 追加 mirrors 配置
cat >> /etc/containerd/config.toml << EOF

[plugins."io.containerd.grpc.v1.cri".registry.mirrors]
  [plugins."io.containerd.grpc.v1.cri".registry.mirrors."docker.io"]
    endpoint = ["https://${MIRROR_URL}"]
  [plugins."io.containerd.grpc.v1.cri".registry.mirrors."registry.k8s.io"]
    endpoint = ["https://${MIRROR_URL}/k8s"]
EOF

# 重启并验证
systemctl daemon-reload
systemctl restart containerd
echo "等待 containerd 启动..."
sleep 3

if ctr -n k8s.io images pull docker.io/library/alpine:latest; then
  echo "✅ 配置成功!镜像拉取测试通过"
else
  echo "❌ 配置可能有问题,请检查 /etc/containerd/config.toml"
  exit 1
fi

5.2 Ansible Playbook(适合中大规模集群)

---
- name: 配置 K8s 集群 containerd 镜像加速
  hosts: k8s_nodes
  become: yes
  vars:
    mirror_url: "替换为你的加速源地址"
  tasks:
    - name: 备份 containerd 配置
      copy:
        src: /etc/containerd/config.toml
        dest: "/etc/containerd/config.toml.bak.{{ ansible_date_time.epoch }}"
        remote_src: yes
        force: no

    - name: 生成默认配置
      shell: containerd config default > /etc/containerd/config.toml
      changed_when: true

    - name: 注入 registry mirrors 配置
      blockinfile:
        path: /etc/containerd/config.toml
        block: |
          [plugins."io.containerd.grpc.v1.cri".registry.mirrors]
            [plugins."io.containerd.grpc.v1.cri".registry.mirrors."docker.io"]
              endpoint = ["https://{{ mirror_url }}"]
            [plugins."io.containerd.grpc.v1.cri".registry.mirrors."registry.k8s.io"]
              endpoint = ["https://{{ mirror_url }}/k8s"]

    - name: 重启 containerd
      systemd:
        name: containerd
        state: restarted
        daemon_reload: yes

    - name: 验证镜像拉取
      command: ctr -n k8s.io images pull docker.io/library/alpine:latest
      register: pull_result
      changed_when: false

    - name: 输出结果
      debug:
        msg: "节点 {{ inventory_hostname }}: {{ '✅ 成功' if pull_result.rc == 0 else '❌ 失败' }}"

执行:

ansible-playbook -i your_inventory.ini containerd-mirror.yml

六、常见问题排查

Q1:修改 config.toml 后 containerd 启动失败

排查步骤:

# 检查配置语法
containerd -C /etc/containerd/config.toml config dump > /dev/null

# 查看 containerd 日志
journalctl -u containerd -n 50 --no-pager

# 如果启动失败,回滚配置
cp /etc/containerd/config.toml.bak.xxxxxx /etc/containerd/config.toml
systemctl restart containerd

Q2:ctr pull 成功但 K8s Pod 仍然 ImagePullBackOff

原因: 命名空间不匹配。K8s 使用 k8s.io 命名空间。

# 检查 k8s.io 命名空间下是否有镜像
ctr -n k8s.io images ls | grep nginx

# 如果没有,重新用 -n k8s.io 拉取
ctr -n k8s.io images pull docker.io/library/nginx:alpine

Q3:TLS 证书验证失败

# 在 config.toml 中为对应加速源跳过 TLS 验证
[plugins."io.containerd.grpc.v1.cri".registry.configs."加速源地址".tls]
  insecure_skip_verify = true

Q4:kubeadm init 初始化集群时镜像拉取超时

在执行 kubeadm init 之前配置好加速,并预拉取核心组件镜像:

# 预拉取 K8s 核心组件镜像
kubeadm config images pull --image-repository=加速源地址/k8s --kubernetes-version=v1.30.0

# 然后初始化
kubeadm init \
  --image-repository=加速源地址/k8s \
  --kubernetes-version=v1.30.0 \
  --pod-network-cidr=10.244.0.0/16

七、方案选型建议

使用场景 推荐方案 核心理由
个人开发 / 学习集群 国内第三方加速服务 配置简单,5 分钟搞定
企业生产集群(有内网) 自建 Registry 代理 可控性强,适合长期运行
CI/CD 流水线 nerdctl + 私有仓库 灵活可控,可集成 GitOps
临时线上应急 国内加速服务 最快恢复服务
离线 / 安防环境 自建 Registry 唯一可行方案

总结

containerd 镜像加速是 K8s 运维的基础设施问题,尤其在 2026 年国内镜像源频繁失效的背景下,提前配置好可靠的加速方案至关重要。

建议生产环境至少配置两种方案互为备份:主方案用国内加速服务(配置简单、速度快),备份方案用自建 Registry(可控性强)。


本文基于 2026 年 4 月中旬实测环境编写。镜像加速源的有效性可能随时间变化,建议定期验证。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐