四叶 AI 酒馆:从零打造一套可私有化部署的 AI 角色聊天系统(附完整架构)
最近我整理了一套端到端的 AI 角色聊天私有化系统,目标不是做一个只能跑通的 Demo,而是把角色聊天、角色库、用户端、后台管理、聊天记录与模型接入能力完整整合,做成一套可直接私有化部署的产品级系统。
目前系统已经稳定运行了一段时间,整体结构清晰,既适合学习 AI 角色聊天系统的完整架构,也适合有私有化部署需求的小团队作为参考原型。
一、系统整体架构
这套系统采用「前后端分离 + 管理后台」的三段式设计,各模块职责清晰、解耦彻底:
表格
| 模块 | 技术栈 | 核心职责 |
|---|---|---|
| H5 用户端 | uni-app + Vue | 移动端用户体验:角色浏览、角色详情、聊天、个人中心、角色创建 |
| 后端服务 | Spring Boot + MyBatis + MySQL + Redis | 核心业务逻辑:用户 / 角色 / 会话 / 消息管理、模型接入、权限控制、并发调度 |
| 管理后台 | Vue3 + Element Plus | 运营管理:角色审核 / 上架、用户管理、标签配置、模型管理、系统设置 |
核心设计思路:前端只负责用户体验,真正的业务逻辑、模型调度、权限控制全部由后端承接,避免了直接把模型接口暴露给前端的安全风险,也为后续扩展打下了基础。
二、已实现的核心功能
目前系统的核心链路已经完全跑通,功能覆盖了 AI 角色聊天的全流程:
✨ 用户端功能
- AI 角色库:支持角色分类、标签筛选、推荐展示
- 角色详情页:角色人设、背景故事、示例对话预览
- 多用户聊天:单用户多会话隔离,聊天记录永久保存
- 流式输出:SSE 协议实现打字机效果,体验丝滑
- 对话控制:支持继续生成、重新生成、上下文编辑
- 角色生态:支持用户创建角色、导入角色卡
⚙️ 后端核心能力
- 多模型接入:兼容 OpenAI 接口、OpenRouter、自定义模型地址
- 权限体系:Token 鉴权、用户隔离、会话隔离
- 并发控制:全局 / 单用户并发限制、有界任务队列、Redis 限流
- 数据持久化:聊天记录、会话信息、角色数据全量落库
📊 后台运营功能
- 角色管理:角色审核、上下架、编辑、批量操作
- 用户管理:用户列表、状态管理、会话查询
- 标签 / 推荐管理:角色分类、热门推荐配置
- 模型配置:多模型管理、默认模型设置、API Key 统一管理
- 系统设置:基础配置、限流配置、部署信息查看
三、关键设计亮点
1. 为什么要加一层自己的后端?
很多人做 AI 角色聊天,会直接把模型接口暴露给前端,这种方式简单但有很多隐患。我的系统在中间加了一层业务后端,带来了这些关键优势:
- 用户系统自主掌控,不用依赖第三方平台账号
- 聊天会话与记录由自己的数据库管理,数据完全可控
- 角色库可以后台审核,避免违规内容上线
- 支持多用户并发控制,防止 API Key 被刷爆
- 可扩展内容审核、额度限制、会员体系等商业化能力
2. 并发控制:避免服务被打满
为了应对用户高频点击生成请求,后端做了完整的并发控制设计:
- 全局生成并发限制,防止服务器过载
- 单用户生成并发限制,避免单个用户占满资源
- 有界任务队列,超出限制的请求自动排队
- 基于 Redis 的分布式锁,保证并发安全
- SSE 流式输出,请求过程中可实时推送状态
四、适用场景与私有化部署
这套系统非常适合这些场景:
- 搭建私有 AI 角色聊天站 / 陪伴类产品
- 企业 / 团队内部私有化 AI 对话系统
- 自有模型 API 接入的测试与产品化验证
- AI 产品原型快速验证(低成本跑通业务闭环)
私有化部署的核心优势:
- 模型 API Key、数据库、角色数据全部由自己掌控
- 可自由扩展功能,不受第三方平台限制
- 无平台分成、无流量限制,成本完全可控
- 可根据业务需求进行二次开发与定制
五、当前状态与后续计划
目前系统已经可以直接部署运行,核心链路完全跑通:用户进入 H5 → 浏览角色 → 创建会话 → 流式聊天 → 保存记录 → 后台管理角色 / 用户 / 模型
后续计划继续完善这些能力:
- 内容审核机制,过滤违规对话
- 角色审核流程,保证角色库质量
- 多模型调度策略,根据场景自动切换模型
- 模型成本统计与用户额度管理
- 完善私有化部署文档,支持 Docker 一键部署
- 更多运营工具(数据看板、用户行为分析)
六、总结
这套系统的核心不是某个酷炫的技术点,而是把 AI 角色聊天从 Demo 变成真正可运营、可部署、可扩展的产品形态:
- 用 H5 做轻量化的用户体验,降低用户门槛
- 用后端承接业务逻辑,保证数据安全与业务可控
- 用后台做运营管理,支撑产品的长期迭代
- 用统一的模型接入层,降低后续换模型的成本
如果你也在研究 AI 角色聊天系统、私有化部署或者 AI 产品架构,欢迎一起交流探讨!









AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)