VTJ.PRO 在线应用开发平台的LLM模型管理与配置

kenny185712818

551人浏览 · 2026-04-07 08:09:46

kenny185712818 · 2026-04-07 08:09:46 发布

LLM 模型管理与配置

本节详细介绍了 VTJ.PRO 平台中大型语言模型（LLM）的基础设施和管理逻辑。系统支持多个提供商、专门的模型用途（如代码生成或多模态视觉），并包含一个缓存层以优化 AI 代理工作流的性能。

数据模型与实体

平台使用结构化的实体模型来定义 LLM 的能力和连接参数。

LLMModelEntity

LLMModelEntity 表示由外部服务提供的特定模型实例（例如 GPT-4、Claude-3）。它包含 API 端点、认证密钥和模型特定参数的配置。

关键字段包括：

name：模型的显示名称。
value：API 调用中使用的技术标识符（例如 gpt-4-turbo）。
provider：服务提供商（由 LLMProvider 枚举定义）。
purpose：主要使用场景（由 LLMPurpose 枚举定义）。
apiKey：提供商的凭证。
baseUrl：API 端点（用于代理服务或本地部署）。

枚举：Provider 与 Purpose

系统对模型进行分类，以确保为特定任务使用正确的工具：

LLMProvider：支持 OpenAI、DeepSeek、Ollama、Moonshot、Zhipu、Groq 和 Anthropic。
LLMPurpose：将模型分类为 Coder（针对 DSL 和代码生成优化）或 Multimodal（支持图像/视觉输入）。

实体关系图

下图说明了 LLMModelEntity 在后端服务层中如何与其操作枚举相关联。

模型实体空间

LLMModelService 实现

LLMModelService 是检索和管理模型的主要接口。它扩展了 BaseCrudService 以提供标准的 CRUD 操作，同时实现了模型选择和缓存的专用逻辑。

缓存支持的检索

为了在频繁的 AI 代理请求期间最小化数据库开销，该服务对模型列表使用了缓存机制。

getModels()：检索所有启用的模型，优先使用缓存结果（如果可用）。
getCoderModels()：过滤模型列表，仅返回标记为 LLMPurpose.Coder 的模型。这些模型通常由 @vtj/coder 引擎用于生成 Vue 组件和 DSL。
getMultiModel()：返回标记为 LLMPurpose.Multimodal 的第一个可用模型，用于图像转代码或基于视觉的分析。

数据流：请求到模型选择

此图显示了针对特定模型（如 Coder 模型）的请求如何从服务层通过缓存流向数据库。

LLM 模型解析流程

管理界面

平台提供了一个专用的管理界面，用于管理 LLM 配置，位于 llms.vue 视图中。

配置界面

管理员可以执行以下操作：

提供商设置：定义新的 LLM 端点，包括为兼容 OpenAI 的代理设置自定义 baseUrl。
凭证管理：安全存储 apiKey 值。
用途分配：明确将模型标记为 Coder 或 Multimodal，以使其在特定工作台工作流中启用。
状态切换：启用或禁用模型，无需删除其配置。

前端集成

管理界面通过 LlmController 与后端交互，该控制器公开了由 LLMModelService 管理的 CRUD 端点。

组件	文件路径	角色
视图	`frontend/src/views/admin/llms.vue`	模型 CRUD 操作的管理界面
控制器	`backend/src/business/llm/llm.controller.ts`	LLM 管理的 REST API 端点
服务	`backend/src/business/llm/llm.service.ts`	业务逻辑和缓存管理

与 AI 代理工作流的集成

在此模块中配置的模型由 AIService 使用。当 AI 代理需要执行任务时：

它根据任务类型（例如聊天 vs. 代码生成）向 LLMModelService 查询合适的模型。
它从 LLMModelEntity 中检索 apiKey 和 baseUrl。
它使用这些参数初始化一个兼容 OpenAI 的客户端实例，以将响应流式传输回工作台。

参考资料

官网文档：https://vtj.pro/
在线平台：https://app.vtj.pro/
开源仓库：https://gitee.com/newgateway/vtj

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

035、特定场景优化（二）：密集场景与遮挡目标的处理

本文针对YOLO模型在半导体产线密集芯片检测中的性能瓶颈，提出了一套系统优化方案。首先通过锚框聚类分析适配芯片尺寸特征，将锚框数量从9个增至12个；其次改进损失函数，采用WIoU和SIoU提升遮挡目标识别能力；再通过自适应NMS策略处理密集目标，并设计遮挡感知模块增强特征提取。部署环节特别关注了边缘设备的量化精度与内存对齐问题。实验表明，该方法在保持实时性的前提下，将漏检率降低至5%以下。作者强调

AtomGit开源社区

2025届必备的十大降重复率助手解析与推荐

AtomGit开源社区

034、特定场景优化（一）：小目标检测的改进策略合集

本文针对工业场景中的小目标检测难题，提出了一套实战优化方案。首先从数据层面建议保持高分辨率输入（1024-1280像素）或采用切块训练策略，并适当放大标注区域。在网络结构上，提出减少下采样次数、增加高分辨率检测头、引入空间注意力机制等改进。损失函数方面推荐使用NWD匹配和QFL损失提升小目标敏感度。部署环节强调NMS优化、分辨率对齐和量化处理技巧。最后总结核心经验：优先优化数据质量而非模型结构，标