大语言模型与私有部署
·
文章目录
一. 大语言模型学习与 api 接口调用
什么是大语言模型?
答:大语言模型是一种通过大量文本数据训练得到的语言理解与生成模型,能够理解自然语言并生成相应的文本内容。
早期的智能问答系统或小规模语言模型通常以单轮问答为主,更多依赖规则或信息检索技术,类似于基于搜索结果的智能问答系统。由于无法读取之前的对话上下文,这类系统往往只能针对当前问题进行回答,难以将多个问题进行关联和串联。
随着技术的发展,大语言模型在模型规模、训练数据和算法方面都有了显著提升,不仅回答更加准确,还具备处理一定长度上下文信息的能力。当用户提出新的问题时,模型可以结合当前对话中的上下文记录进行理解和推理,从而实现多轮连续对话。虽然模型本身并不具备真正的长期记忆,但在一次对话中可以通过上下文实现问题之间的关联。
现阶段模型如此之多呢?
答:大模型数量众多,主要是因为不同公司在不同技术路线和应用场景上持续进行研发和竞争,同时模型也在不断迭代升级。随着技术的发展,当前的大模型不仅可以进行文本问答和内容生成,还逐渐具备多模态能力,例如根据文本生成图片、视频,以及进行代码生成和辅助编程等,从而满足更多不同场景的应用需求。
模型使用建议
答:所谓术业有专攻,不同模型在能力和擅长领域上有所差异。虽然模型的调用方式大体相似,但在实际使用时,应根据具体需求选择合适的模型。例如,在进行文本问答或内容生成时,可以选择 GPT、Claude、Gemini、通义千问、DeepSeek 等语言模型;在需要进行文本生成图片时,可以使用 Midjourney、Stable Diffusion、DALL·E 等模型;在需要生成视频内容时,可以使用 Sora、Runway 等视频生成模型;在代码生成或辅助编程场景中,可以使用 GPT、Claude、DeepSeek-Coder、Code Llama 等模型,从而获得更好的效果和效率。
二. 大模型私有部署
初次部署大模型
为什么要部署私有大模型?
部署后可以干什么?
三. 大模型管理平台
大模型管理平台是干什么的?
有那些大模型管理平台?
四. 人工智能应用平台、大模型开发平台、AI 聊天助理应用开发
如下为功能区分,后续学习总结到对应文章中
hugging-face 大模型开发平台和人工智能应用平台 Dify和人工智能应用平台 Coze和dify AI 聊天助理应用开发都是大模型或者智能体相关的开发平台嘛?
可以说都和大模型或智能体有关,但类型不完全一样,大致分三类:
Hugging Face 是 大模型/AI模型开发与托管平台。 主要做: 模型发布和下载 模型训练、微调 模型推理服务 数据集管理 更偏 模型层开发平台,面向算法工程师和AI开发者。
Dify(人工智能应用平台) 是 大模型应用开发平台(LLM App Platform)。 主要用来: 开发AI应用 RAG知识库问答 AI Agent AI工作流 多模型接入 属于 AI应用开发层平台。
Coze(人工智能应用平台) 是 AI Agent / Bot开发平台。 主要用来: 创建智能体或机器人 配置工具调用 发布到聊天平台(如Telegram、Discord、飞书等) 属于 智能体/机器人平台。
Dify AI聊天助理应用开发 这不是一个新的平台,本质上是 用 Dify 平台开发的一类AI应用,例如: AI客服 企业知识库助手 AI问答机器人 也就是 具体的AI应用场景。
简单总结:
Hugging Face → 大模型开发/模型平台 Dify → 大模型应用开发平台 Coze → 智能体 / 机器人开发平台 Dify AI聊天助理开发 → 用Dify做的一种AI应用类型 所以它们都属于 大模型生态相关平台或应用开发方式,但处在不同层级。
五. 自动化工作流平台
六. 大语言模型微调
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)