PyCaret:一台电脑就能跑的自托管机器学习平台
PyCaret:一台电脑就能跑的自托管机器学习平台
PyCaret 是一个开源的自托管机器学习平台,目前收获了 9,803 个 Star:


PyCaret 把 AutoML 引擎、控制平面和 Web 界面整合进一个可本地部署的包。一条 docker compose up 命令,大约 5 分钟就能在 http://localhost:3020 跑起来。
当前正在开发 4.0 版本,属于从底层重构的新一代架构。3.x 版本已冻结在 PyPI 的 pycaret 3.4.0,不再更新。
平台组成
PyCaret 由三个核心模块构成:
- Engine:基于 sklearn 1.7 的 AutoML 库,支持分类、回归、聚类、异常检测和时间序列任务。一次实验会自动训练约 12 种算法,输出排行榜。
- Control plane:FastAPI 后端,提供工作区、项目管理、实验记录、模型注册表、部署管理、审批流程、监控、漂移检测、血缘追踪和调度功能。
- Web UI:React + Vite 构建,默认暗色主题。所有配置均通过点击完成,不需要手写 YAML。
本地部署
前置条件只有 Docker Desktop 4.27+。执行以下命令:
git clone https://github.com/pycaret/pycaret.git
cd pycaret
docker compose up --build
首次构建约需 5 分钟,后续启动在 30 秒以内。服务运行后,打开 http://localhost:3020 即可进入初始化页面,创建管理员账户和工作区。
docker compose 默认启动两个容器:nginx 托管的 React 前端,以及一个 FastAPI 进程。后者同时承载调度器、计算线程和 SQLite 数据库,采用 Plausible、Vaultwarden 等工具常见的单二进制部署模式。适合个人电脑,也可以支撑小团队的生产环境。
完整工作流
按照黄金路径走一遍,大约 10 分钟就能完成从数据到预测服务的闭环:
- 初始化管理员账户和工作区
- 在 Settings 里配置 LLM API 密钥,开启 AI 数据集顾问和实验设计助手
- 上传数据集,或从内置样本中选取
- 创建项目,新建实验,选择数据集和任务类型
- 系统自动训练多个算法,在排行榜中选出表现最优的模型
- 将该模型提升为 v1,放入模型注册表
- 部署模型,指定端点名称
- 在部署详情页测试预测,或通过 curl 调用 API
开发方式
如果需要修改代码,可以直接在本地运行前后端:
uv sync --all-packages --all-extras
cd apps/web && npm install
# 终端 1
uv run --package pycaret-server pycaret-server serve --reload
# 终端 2
cd apps/web && npm run dev
架构设计
当前的 docker compose 部署刻意保持精简,所有外部依赖(存储、数据库、密钥、认证、队列、计算)都设计为 Protocol 接口,支持本地实现和云端实现互换。存储和数据库已经完成抽象,其余五个 Protocol 的拆分排入第一阶段工作。完成后,API、工作节点和运行时容器可以独立部署,指向 RDS、S3、SQS 等云资源。
许可证
Engine 模块采用 MIT 许可证,Control plane 和 Web UI 采用 BUSL-1.1,四年后自动转为 Apache-2.0。自托管生产使用在附加使用授权范围内不受限制。
plane 和 Web UI 采用 BUSL-1.1,四年后自动转为 Apache-2.0。自托管生产使用在附加使用授权范围内不受限制。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)