AI大模型崛起：三大特征、类型解析及中国典型案例深度剖析！

乔代码嘚

307人浏览 · 2026-03-26 14:34:18

乔代码嘚 · 2026-03-26 14:34:18 发布

1、AI 大模型主要特征

AI 大模型具有泛化性(知识迁移到新领域)、通用性(不局限于特定领域)以及涌现性(产生预料之外的新能力)特征。以 ChatGPT 为代表的 AI 大模型因其具有巨量参数和深度网络结构,能学习并理解更多的特征和模式,从而在处理复杂任务时展现强大的自然语言理解、意图识别、推理、内容生成等能力,同时具有通用问题求解能力,被视作通往通用人工智能的重要路径。

AI 大模型的三大特征：泛化性、通用性、涌现性

2、 AI 大模型主要类型

按照部署方式划分，AI 大模型主要分为云侧大模型和端侧大模型两类。云侧大模型由于部署在云端，其拥有更大的参数规模、更多的算力资源以及海量的数据存储需求等特点；端侧大模型通常部署在手机、PC 等终端上，具有参数规模小、本地化运行、隐私保护强等特点。

具体而言，云侧大模型分为通用大模型和行业大模型；端侧大模型主要有手机大模型、PC 大模型。从云侧大模型来看，通用大模型具有适用性广泛的特征，其训练数据涵盖多个领域，能够处理各种类型的任务，普适性较强。行业大模型具有专业性强的特点，针对特定行业（如金融、医疗、政务等）的需求进行模型训练，因而对特定领域具有更深的业务理解和场景应用能力。从端侧大模型来看，手机和 PC 大模型由于直接部署在设备终端，让用户体验到更加个性化和便捷的智能体验。

当前，我国 AI 大模型产业呈现蓬勃发展的态势。伴随多家科技厂商推出的AI 大模型落地商用，各类通用、行业以及端侧大模型已在多个领域取得了显著的成果，如在金融、医疗、政务等领域，AI 大模型已成为提升服务质量和效率的重要手段。我国具有代表性的通用 AI 大模型主要包含科大讯飞的讯飞星火认知大模型、百度公司的文心一言大模型、阿里巴巴的通义千问大模型等；行业AI 大模型主要涵盖蜜度的文修大模型、容联云的赤兔大模型、用友的 YonGPT大模型；同时具有云侧和端侧大模型的端云结合 AI 大模型主要有 vivo 的蓝心大模型；端侧 AI 大模型主要以蔚来的 NOMI GPT 大模型为代表。

中国 AI 大模型分类及典型案例

3、中国 AI 通用大模型典型案例

案例一：科大讯飞—讯飞星火认知大模型

（1）大模型简介：

讯飞星火认知大模型是科大讯飞推出的新一代认知大模型，可实现基于自然对话方式的用户需求理解与任务执行。讯飞星火从赋能万物互联时代的人机交互、赋能知识学习与内容创作、提升数智化生产力三个方面展现其应用能力。讯飞星火认知大模型具备七大核心能力：文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力。

（2）大模型优势：

2024 年 1 月，讯飞星火认知大模型 V3.5 发布，七大核心能力全面提升。据科大讯飞宣称，数学、语言理解超 GPT-4 Turbo，在代码能力方面已经达到GPT-4Turbo 的 96%。另外，星火大模型在多模态理解方面达到 GPT-4V 的 91%，其中语音的多模态能力已经超过 GPT-4。

讯飞星火认知大模型 V3.5 七大能力

讯飞星火认知大模型 V3.5 从三个角度展示了模型能力的提升，赋能万物互联时代人机交互、赋能知识学习与内容创作、提升数智化生产力。人机交互方面，讯飞星火 V3.5 在语义理解、指令跟随和多轮对话中展现优异能力，在情绪感知和拟人合成方面也有出色表现；知识学习与内容创作方面，要素抽取、问题生成等底层能力的进步，能够帮助知识学习和内容创作领域，产生更丰富更有用的智能体。讯飞星火大模型能够结合外部知识进行合理拓展，做到“旁征博引”；数智化生产力方面，逻辑推理能力和时空推理能力并重，数学则是大模型的基础能力，而代码能力用于生成各种工具链接虚拟和现实世界，最后多模态能力也是机器人、工业、家庭等场景中必备的能力。讯飞星火 V3.5 在这些关键技术领域取得显著进步。

（3）大模型应用：

讯飞星火七大能力的提升，实现了各类应用场景性能升级。语言理解方面，情感分析可以提取文本情感色彩更好了解内容观点和态度。文本摘要总结简洁准确的摘要，快速理解文章的核心观点；文本生成方面，科大讯飞推出可以一键快速自动生成文档和 PPT 的办公产品——讯飞智文，主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI 自动配图、多种模板选择、演讲备注等；知识问答方面，讯飞星火对生活常识问答、医学知识问答、政策问答等任务“信手拈来”；逻辑推理方面，思维推理可以通过分析问题的前提条件和假设来推理出答案或解决方案，给出新的想法和见解。科学推理则使用已有的数据和信息进行推断、预测和验证等科学研究中的基本任务；数学能力方面，讯飞星火可以解决方程求解、立体几何、微积分、概率统计等数学问题；代码能力方面，讯飞星火能根据注释、函数名智能生成代码，支持逐行代码注释，还可以精准定位代码语法、逻辑错误，甚至可以智能生成单元测试数据；多模态能力方面，讯飞星火可根据用户上传图片返回准确的图片描述，或完成针对图片素材的问答，还可以凭借用户描述，生成期望的音频和视频。

案例二：百度公司—文心一言大模型

（1）大模型简介：

文心一言是百度研发的人工智能大语言模型产品，具备跨模态、跨语言的深度语义理解与生成能力，在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等众多领域都能为用户提供高质量服务。文心一言拥有四大基础能力：理解能力、生成能力、逻辑能力、记忆能力。

（2）大模型优势：

2023 年 10 月发布的“文心大模型 4.0”，相比上一代文心大模型，四大能力显著升级，其中逻辑提升幅度是理解的 3 倍，记忆提升幅度是理解的 2 倍。理解能力方面，文心一言能听懂潜台词、复杂句式、专业术语、前后乱序、模糊意图等复杂提示词，也能胜任代码理解与调试任务；生成能力方面，文心一言能快速生成风格多样的文本、代码、图片、图表、视频，比如进行文案创作、制定生活计划、编写高质量代码；逻辑能力方面，文心一言能帮用户解决复杂的逻辑难题、困难的数学计算、重要的职业/生活决策、代码纠错、常识推理、逻辑校验、立体几何、辩论灵感等；记忆能力方面，经过多轮对话后，文心一言依然能记住对话的重点，轻松胜任复杂问题、沉浸体验角色对话。

文心大模型 4.0 的能力提升源自相关举措：（1）在万卡算力上基于飞桨平台，通过集群基础设施和调度系统、飞桨框架的软硬协同优化，支持了大模型的稳定高效训练。（2）通过建设多维数据体系，形成了从数据挖掘、分析、合成、标注到评估闭环，充分提高数据的利用效率，大幅提升模型效果。（3）基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐，保证了模型能够更好地与人类的判断和选择对齐。（4）利用可再生训练技术通过增量式的参数调优，有效节省了训练资源和时间，加快了模型迭代速度。

文心大模型 4.0 典型特征

（3）大模型应用：

文心大模型在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等方面已有应用面向用户开放。文学创作方面，文心一言可以清晰地表达观点、传递情感，因此可以应用于小说、散文、诗歌等文学作品的创作中；文案创作方面，在商业领域，文心一言可以撰写商业计划、市场分析报告等商业文案，提供有力的文字支持。文心一言可以激发创意思维，为广告行业提供新的灵感和想法，可以帮助广告人员快速构思出吸引人的广告文案和宣传语；搜索问答方面，基于文心一言的聊天机器人可以与用户进行自然语言交互，理解用户的意图和需求，并提供相应的回答和建议。这种应用可以广泛应用于生活服务、教育辅导、客服等领域；多模态生成方面，文心大模型支持图像生成和处理，可以根据用户需求生成图像或者对已有图像进行处理编辑。文心大模型还支持语音合成、语音识别和音频分类。文心大模型还能对视频数据进行处理，或将文本转化为动态图像序列完成视频分类、目标检测等任务；数理逻辑推算方面，文心大模型可以解决复杂的数学问题，也可以成为代码编写助手，比如百度基于文心大模型研制了智能代码助手 Comate，提供智能推荐、智能生成、智能问答等多种功能，支持多种编程语言和 IDE。

案例三：阿里巴巴—通义千问大模型

（1）大模型简介：

通义千问是阿里云研发的预训练语言模型，基于先进的自然语言处理技术（NLP）, 执行理解、生成和解释人类语言、图片和文档等任务。通义千问能在创意文案、办公助理、学习助手、趣味生活等方面为使用者提供丰富的交互体验。通义千问具备中英文理解、数学推理、代码理解等能力。

（2）大模型优势：

2023 年 10 月，千亿级参数大模型通义千问 2.0 发布,相比 1.0 版本，其在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。中英文理解能力是大语言模型理解和表达的基础能力，英语任务中，通义千问 2.0 的 MMLU（伯克利大学、哥伦比亚大学等联合发布）基准得分是 82.5。中文任务中，通义千问 2.0 在模型训练中学习了更多中文语料，在 C-EVAL（上海交大和清华联合研发的中文大语言模型测试集）基准上获得最高分；数学推理方面，在推理基准测试 GSM8K（OpenAI 发布的小学数学测试集）中，通义千问排名第二，展示了强大的计算和逻辑推理能力；代码理解方面，HumanEval（OpenAI发布）测试衡量大模型理解和执行代码片段的能力，通义千问排名第三，这一能力是大模型在编程辅助、自动代码修复等场景的基础。

（3）大模型应用：

通义千问目前主要应用于四个方向：创意文案、办公助理、学习助手、趣味生活。创意文案应用包括：“撰写营销文案”，输入产品介绍获得量身定制的金牌营销文案。“文章润色”能对用户提交的文章进行深度分析，挖掘其中表达不足之处，提供词汇句式变化建议。“直播带货剧本生成”，基于丰富的商品信息和用户需求，为电商主播提供生动有趣且具有营销力的脚本内容；办公助理应用于：“SWOT 分析”为用户提供全面、深入且精准的战略决策支持，从多元视角理解并评估内外部环境对特定项目的影响。“PPT 框架生成”，智能地为用户构建专业且逻辑清晰的 PPT 结构；学习助手应用包含了：“题目加工厂”，根据提供的专业以及学科领域进行高质量试题生成，大大节省了教师、家长以及教育机构在出题上的时间和精力。“学习计划站”可为用户提供个性化、系统化的学习路径规划，定制高效且科学的学习日程安排；趣味生活应用有：“会放飞的菜谱”，输入菜名逐步指导提供美食烹饪秘诀。“AI 健身教练”为用户制定专属健身计划。“写歌词”，根据用户提示的歌名写出生动歌词。

案例四：容联云—赤兔大模型

（1）大模型简介：

赤兔大模型是容联云开发的面向企业应用的垂直行业多层次大语言模型，赋能企业搭建专属智能客服和数智化营销，完成从“降本增效”到“价值创造”的进化。丰富的智能应用为赤兔大模型能力保驾护航，包含会话洞察、业务话术、问答知识库、知识运用、数据分析、智能对话框架、流程管理。

（2）大模型优势：

赤兔大模型三个核心点分别是智能性、可控性和投产比。智能性方面是客户最关心的，首先能力是否足够丰富，能否解决以前不能解决的问题以及相关能力到底能做多好。智能性方面，包括检索增强、会话分析、逻辑推理、数据分析。

检索增强是指在海量文档中快速定位到信息，经过整理给客户提供答案。会话分析能让模型在对话中发现多维度信息，包括情绪、立场、各种细节的意见，并且根据不同业务快速切换业务场景。逻辑推理体现在推荐话术的原因，投诉、预警的原因这种因果分析能力。数据分析体现在对数据更细致且自动化的分析，减少技术人员和业务人员的数据层面上的操作；可控性方面，赤兔大模型在道德、伦理、安全、风格、偏好上对齐，对话或话术生成时满足基本安全需求。另外让模型知道应该处理的知识范畴、知识边界，从而避免自由对话潜在的安全风险和资源消耗；投产比方面，大模型强大能力来源于大规模，而大规模需要大投入，合理的投产比是客户采取方案的底层逻辑。所以明确是否所有场景都需要大模型，AI 底座上，没有摒弃小模型，大小模型相配合完成对上层能力的输出。机制上合理调动分配，比如有的环节大模型靠后完成线下或离线的工作，有的环节大模型调动指挥小模型完成。

（3）大模型应用：

基于赤兔大模型，容联云发布了生成式应用“容犀 Copilot”。容犀 Copilot具备三大核心能力：大模型话术、智能知识库、会话洞察。大模型话术：容犀Copilot 后台一键快速对海量历史会话数据进行核对筛选，挑选出更佳话术并生成金牌话术，兼顾质与量的同时，挖掘出客户高频关注的问题，从问题中洞悉业务痛点；智能知识库：可以帮助企业从零开始、低成本地快速构建话术库，包括理解文档知识、知识快搜、智能问答等，大幅提升构建效率；会话洞察：高效便捷洞察每一通会话沟通情况，分析客户诉求，精准诊断问题并优化。回归实际业务本身，容犀 Copilot 深入金融行业细分场景，打造场景化客服助手，譬如分期挽留助手、荐卡挽留助手、投诉安抚助手等，实时辅助快速洞察客户需求，推荐更佳应答话术，诊断客户情绪变化，提醒措辞及注意事项。

容犀 Copilot 产品应用场景

案例五：蜜度—文修大模型

（1）大模型简介：

文修大模型是蜜度推出的一款聚焦于智能校对领域的大语言模型，基于蜜度在校对领域的知识和经验积累，为政务单位、新闻媒体、企业单位、学校机构、出版机构等专业用户提供更贴合使用场景的校对服务。文修大模型具备校对能力强、速度快、匹配度高三大特点，更好地解决垂直行业的问题。

（2）大模型优势：

数字化时代，内容创作与传播速度惊人，信息准确无误地传达给公众尤为重要，蜜度文修大模型通过优秀的校对能力、高效的处理速度和高度的匹配度应对变局。校对能力方面，文修大模型以拼写错误、语义错误、语法错误为基础，以内容差错、常识校对差错、内容风险识别三大类校对类型，27 类细分类型为校对标准，有效满足出版行业、新闻行业的“三审三校”的校对规范和实际业务需求，提供诸如广告法检测、常识校对等更为全面的校对服务；校对速度方面，文修大模型几秒钟就能校对完一篇千字文章，几分钟即可校对一本 10 万字书稿。

其快速校对的背后是实实在在的“学习能力”，文修大模型能迅速将人们短时间内难以学习消化的内容，转变成自身的校对能力，完成快速输出；匹配度方面，蜜度服务政府部门、媒体单位十余年，数十款智能应用产品及解决方案，覆盖政务部门、出版单位多个办公环节及场景，拥有成熟的流程服务，在洞察用户需求和使用场景方面拥有深厚的经验。

（3）大模型应用：

文修大模型满足政务单位、新闻媒体、企业单位、学校机构、出版机构的多行业场景应用需求。政务单位领域，赋能各级政务部门校对流程智能化，提供文字材料的内容错敏校对、修改提示和文本润色等服务，全力保障内容的准确性及严谨性，支持内网环境下校对，满足更高保密需求；新闻媒体领域，文修大模型深入新闻媒体工作的各个环节，对多模态内容进行多类错敏校对，帮助快速定位错误并高亮显示，让内容更加规范严谨，有效维护官方账号的公信力；同时提供文本润色服务，提高出稿速度，保障新闻时效性；企业单位领域，全流程切入企业办公场景，从内容纠错、提升文本质量等多方位出发，优化宣发内容，提高文案吸引力，助力营销效果显著提升；学校机构领域，针对学校机构的宣传材料、新媒体稿件、科研报告、学术论文等内容进行全面校审，有效降低文字错误率，保障学术严谨性。通过 AI 润色功能助力文章、报告、材料的起草、优化工作，有助于进一步提升学校传播力、影响力；出版机构领域，提供专业、便捷、高效的内容筛查及文字质量把关服务，协助各出版机构高效处理多语言文本，降低内容差错概率，保障内容的规范性、准确性。

案例六：用友—YonGPT 大模型

（1）大模型简介：

YonGPT 是用友基于数字和智能技术服务企业和公共组织数智化的企业服务大模型。YonGPT 在企业服务领域的应用主要集中在 4 个方向：智能化的业务运营、自然化的人机交互、智慧化的知识生成、语义化的应用生成。

（2）大模型优势：

用友人工智能研发团队基于大规模的商业应用数据，结合企业应用场景和领域经验，标记了大量的企业服务语料数据，形成丰富的企业服务大模型训练素材，并将业务知识与领域经验融入企业服务大模型，确保了 YonGPT 的专业性、实用性及领先性。同时 YonGPT 通过上下文记忆、知识库表索引、Prompt 工程、Agent执行、通用工具集等扩充大模型的存储记忆、适配应用和调度执行能力，形成体系化的企业服务大模型。YonGPT 还优化了企业服务大模型的训练效率和成本，集成了丰富的开发工具和优化算法，通过自有的数据管理、大模型精调、大模型评估优化、大模型推理和插件服务等功能，为大模型的构建和服务提供稳定且有效的支撑。

（3）大模型应用：

用友企业服务大模型 YonGPT 围绕四个方向推进模型训练和产品效果优化，提供深入到客户业务前端的全价值链、全场景的泛在智能和群体智能应用。在智能化业务运营方面：YonGPT 通过强大的数据分析和预测能力，深入洞察企业运营、识别潜在的业务风险和机会，并提供智能化的解决方案，从而提高经营决策水平和业务运营效率；在自然化人机交互方面：YonGPT 通过强大的自然语言处理技术和理解能力，使能企业应用和服务与用户进行自然而流畅的对话交流，以“人”为本的方式实现不同应用的调用、连接、组装，更自然、高效地完成工作；在智慧化知识生成方面：YonGPT 通过从海量数据和信息中提取、整合知识，生成新的、有价值的知识内容，涵盖了行业解决方案、专业领域知识分享，助力企业和用户全面利用自身知识的储备和积累，促进知识的传播和应用；在语义化应用生成方面：YonGPT 通过对用户需求、企业业务和数据特征的理解，可以自动生成具有语义化能力的应用程序，全方位提升企业个性化应用服务的创建效率。

此外 YonGPT 在智能化场景服务中实现四个服务：企业收入/利税经营智能分析，可以实时掌控经营状况、快速洞察问题所在、精准预测企业效益、有效预见应对变化；智能生单，融合了丰富的供应链经验，通过“交互革新式”订单生成助手，实现快速智能生单，提高企业效能；智能招聘，帮助企业快速精准识别定位目标人才，从海量简历池中发现人才，通过 AI 互动优化应聘体验，实现选人、用人的精准决策；智能大搜，提供“沉浸式”搜索新体验，加速企业知识的价值化服务，并洞察用户需求、实现搜推一体，让知识赋能业务和组织。

案例七： “写易”智能创作引擎

（1）大模型简介：

“写易”智能创作引擎是人民网推出的垂类写作大模型，依托自主研发的主流价值观大模型针对写作场景训练而成。“写易”智能创作引擎适合党政党媒、央企国企、学校医院等有日常阅读需求和写作需求的群体，提供专业权威、系统整体、持续更新的数智服务，从而更好地启发创作者的写作灵感。

“写易”智能创作引擎产品架构

（2）大模型优势：

“写易”智能创作引擎深入挖掘用户需求，构建了“随查”“随写”“随审”的交互体验, 具有创作高效、安全准确、内容丰富的特点。其主要功能有：高效的智能创作引擎：“写易”智能创作引擎依托于超过 25 万条的权威主流语料库，创新性地实现了基于检索增强的辅助生成能力。可通过标题自动生成优质核心内容，同时结合标题与观点等上下文信息，为用户生成相关性更强、准确性更高的文章素材，从而显著提升写作效率；专业的涉政内容审校：1.原文引用检测：检测文本是否引用了重要讲话、重要政策文件，分析引用的规范性，同时给出原文的出处等溯源信息。2.规范表述审校：对领导人重要讲话、党和国家重大政策重要文件等文本进行规范性检测。3.人物信息审校：对文本中出现的人物姓名及职务信息等进行勘误检测。4.关键信息审核：检测文本中有标志性、代表性的重大事件、重要人物、重要敏感信息等内容。5.基础纠错：对文本中的错别字检测、标点符号错误检测，包括中文、英文拼写、成对标点、特殊数字与符号等错误；内容丰富的写作素材知识库：依托人民网和人民日报，配备强大的资料库，系统化整理信息，按照时间、内容、形式、图文音频等多维度进行分类汇总。及时同步《人民日报》每日的精选文章，实时提炼更新当日最优标题、最美佳句、最优词语等内容，为用户提供新鲜的写作素材。

（3）大模型应用：

“写易”智能创作引擎，服务于以国资央企、党政机关、事业单位、党媒党网、地方融媒体、教育系统、医疗系统等为重点的全行业客户，满足客户在不同场景中的定制化高效写作需求。“写易”智能创作引擎可结合客户数据库进行定制，具体而言，人民网以行业客户数据库语料为核心，《人民日报》内容为辅助，为客户定制化训练“写易”智能创作语言大模型，帮助提高写作能力、积累写作素材、规范写作格式。在写作过程中还可以为标题撰写、修辞使用、引用诗文和网言网语等提供丰富素材，帮助创作者启发灵感、提供思路，从而自动、高效地生成符合客户写作场景的高质量文章素材，为客户提供全维、全时、全域的智能化服务，助力工作总效率大幅提升。

案例八：vivo—蓝心大模型

（1）大模型简介：

蓝心大模型是行业首个在手机端运行的开源自研大模型，也是更适合中文用户的中文开源大模型，其包含十亿、百亿、千亿三个参数量级，共 5 款自研大模型（10 亿、70 亿、700 亿、1300 亿和 1750 亿）。随着参数提升，蓝心大模型逐渐具备文本总结、语言理解、文本创作、知识问答、角色扮演、复杂逻辑推理、复杂任务编排等能力。基于蓝心大模型能力，vivo 开发出蓝心小 V 和蓝心千询两款手机端产品。

vivo 蓝心大模型矩阵

（2）大模型优势：

1）矩阵化优势

vivo 大模型矩阵具有不同参数量级、多种部署方式，可应用于不同使用场景，在满足用户手机体验的同时，优化大模型推理性能以及端侧部署时占用的手机内存、功耗。10 亿参数的蓝心大模型（1B），是面向端侧场景打造的专业文本大模型，具备本地化的文本总结、图片风格化能力，适用于需要快速本地化摘要、生图的场景；70 亿参数的蓝心大模型（7B），是面向手机打造的端云两用模型，有良好的上下文关联能力和任务拆解能力，在语言理解、文本创作等场景下表现优秀。蓝心大模型 7B 也是手机行业首家开源的大模型，实现 AI 普惠；700亿参数的蓝心大模型（70B），是 vivo 面向云端服务的主力模型，在角色扮演、知识问答等场景下表现优异，既有智能涌现，也能兼顾成本和性能。面向复杂任务，vivo 也推出了两款千亿参数模型，1300 亿和 1750 亿大模型，凭借更丰富的知识量提供更加专业的智能体验。

2）端侧优势

蓝心大模型 1B 和蓝心大模型 7B 可在手机端运行，展现了出词快、内存低、全天候、真安全的强大端侧运行优势。出词快：vivo 对手机端上的 1B 模型优化，测试出字速度极限可达 60 字每秒，远超人眼约 10-20 字每秒的阅读需求；内存低：vivo 优化模型在手机端的内存占用问题, 蓝心大模型 1B 和蓝心大模型 7B分别只需占用 1.3G 和 3.8G 手机内存。全天候：将蓝心大模型置于终端设备上可以减少数据延迟，并能够满足例如出差飞机、高铁等无网弱网场景下的大模型使用需求，使得一些应用可以全天候正常运行。真安全：vivo 实现端侧内容安全过滤模型，优化输入语料和大模型生成内容的合规性问题，端侧大模型有助于在本地处理数据形成闭环，减少了敏感信息通过网络传输的风险，为大模型应用场景落地移动终端提供安全基石。

3）算法优势

蓝心大模型具备三大算法优势：强大的基础能力、精准的指令跟随以及正确的价值取向。首先，强大的基础能力是大模型的根基。在预训练阶段，vivo 利用最前沿的 Transformer 架构，改良注意力机制、位置编码等关键模块，采用混合精度训练以及梯度缩放策略缩短训练周期。其次，精准的指令跟随是大模型与用户交互的核心。vivo 对于微调采用“target only loss”方法，并通过聚类分析对指令进行适应性处理，以更好地确保模型的均衡性。第三，正确的价值取向是大模型的灵魂。在强化学习阶段， vivo 建立了 300 余名专业人员组成的审核团队，制定了 200 余项的安全审查机制，对模型的输出进行筛查和标注。同时，vivo 采用离线采样策略和双重奖励模型等策略，在安全性上有明显提升。

（3）大模型应用：

1）蓝心小 V

蓝心小 V 是 OriginOS 4 上搭载的一款全局智能辅助功能，支持超能语义搜索、超能问答、超能写作、超能创图、超能智慧交互。超能语义搜索：使用自然语言即可搜索手机中的照片、文档、日程等信息；超能问答：根据用户上传的文档，快速提供文档总结，也可根据文档内容快速问答，还可以是知识百科开放式问答；超能写作：基于用户的要求，结合 AI 能力给用户生成文本，如润色、扩写、总结、格式文本等；超能创图：1、文生图和图生图：基于用户文字描述或上传图片，生成目标图片。2、AI 路人消除（路人隐身）：上传包含路人的图片，通过对话消除路人，生成更为纯净的图片；超能智慧交互：1、智能识屏服务功能：一键识别屏幕上的文本、网页链接，提取有效信息；2、超直觉化的交互方式：交互更多元，语音、文字、点击、拖拽、悬浮形式，互动更轻松。

2）蓝心千询

vivo 基于蓝心大模型打造的全天侯 AI 私人小帮手——蓝心千询，覆盖 AI对话和 AI 灵感两大核心应用场景。蓝心千询是手机行业首个大模型公开版免费APP。AI 对话模块，蓝心千询支持“超能问答”以及“超能创图”两大功能，用户可以通过 AI 对话进行文本问答、开放问答或是基于文档的问答，以高效获取信息、知识。另外，无论写诗、AI 作画、创作歌词、撰写标题/活动方案，蓝心千询皆可胜任。AI 灵感模块，蓝心千询能够提供社交媒体文案创作、PPT 大纲生成、中英文本互译等功能，还设置有穿搭建议等有趣的灵感工具。灵感广场设置有不同场景下的灵感技能卡片，覆盖工作、学习生活中的创作场景。蓝心千询将基于卡片语境快速生成对应文案，为用户的工作、学习、生活提供广泛灵感支持。

AI行业迎来前所未有的爆发式增长：从DeepSeek百万年薪招聘AI研究员，到百度、阿里、腾讯等大厂疯狂布局AI Agent，再到国家政策大力扶持数字经济和AI人才培养，所有信号都在告诉我们：AI的黄金十年，真的来了！

在行业火爆之下，AI人才争夺战也日趋白热化，其就业前景一片蓝海！

我给大家准备了一份全套的《AI大模型零基础入门+进阶学习资源包》，包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。😝有需要的小伙伴，可以VＸ扫描下方二维码免费领取🆓

在这里插入图片描述