大厂都在用 AI 做什么？我在 2026 D2 AI 大会学到的精华

拭心

732人浏览 · 2026-03-27 09:13:12

拭心 · 2026-03-27 09:13:12 发布

大家好，我是拭心。

2026 年 3 月 21 日，第 20 届 D2 技术大会顺利落幕，参会人有 2000+，非常热烈。

我带着“看看大厂都在用 AI 做什么”的目的参会，一天下来，有蛮多收获。

在此记录一些个人觉得有价值的信息，希望对你有帮助。

一、会议信息

D2 官网: https://www.d2conf.com/

过去的一年里，“AI 会不会取代程序员”“前端还有没有未来”“终端是不是要消失了”这样的讨论此起彼伏。技术范式在快速更迭，焦虑是真实的，但机会同样也是。

D2 一如既往地选择和终端开发者站在一起，用一次扎实的线下大会，和大家一起面对 AI，理解 AI，用好 AI。直面AI技术带来的挑战，把握AI创新打造的机遇。

本次会议的精彩图片：https://v.pixcheese.com/s/5XbTNgz6v5j

会议内容：

二、精华总结

2.1 大厂都在用 AI 做什么

2.1.1 各厂具体 AI 落地程度

阿里巴巴：开发了 AI 工程框架&多 Agent 体系落地

自研了一个 AI Engine 应用开发框架 +统一AI网关，支持异构模型、流式异步、GPU弹性伸缩
落地了三种工作流（fix/AI enable/agent workflow）+多智能体模式（指挥官/network/团队模式）
应用于电商商品生成、数据分析、供应链备货、营销业务等场景
成熟度：历经3年迭代，从模型开发升级至高代码应用框架，电商场景规模化商用

淘宝：开发了一个 TGUI 框架， AIGC 交互框架+AI研发提效

打造TGUI框架，解决AI生成内容的可交互UI渲染，优化解析/渲染/展示性能
实现端侧MCE能力，让AI操盘APP，通过降级+流式修复解决大模型幻觉
成熟度：构建AI生成UI的标准化底座，替代传统Markdown渲染，适配电商复杂交互场景

腾讯音乐（TME）：开发了复杂的 D2C 平台，设计稿转码AI精准协同

通过算法清洗设计稿、人工介入引导，解决大模型TOKEN膨胀与幻觉问题
实现图层清洗、空间推理/粗分、组件复用、多端转码、局部变更推理
开发插件系统支持国际化、颜色TOKEN等定制化诉求，落地飞书插件、CR应用
成熟度：工程化深度落地，解决设计稿转代码的还原度、工业化适配难题，达到商用级精度

天猫：实现了团队级 AI 全栈研发解决方案

建立AI编码离线评测+漏斗追踪系统，知识物料采纳率从18%提升至35%
通过四层代码物料注入，AI代码产量率从76%提升至近98%
接入Chrome CDP协议赋予AI调试能力，简化研发流程，新人环境搭建从2小时缩至30秒
成熟度：完成团队级AI研发体系搭建，覆盖编码、调试、流程自动化，进入规模化推广阶段

千问硬件：展示了端侧 AI 交互+AI Coding Agent

落地AI眼镜端侧交互，实现提词、实时信息辅助等功能
成熟度：端侧AI硬件实用化

Cursor：分享了大规模 Agentic 编程系统工程是如何优化的

实现端云分离架构，适配多客户端、灵活切换模型、便捷AB测试
通过HTTP2、TOKEN预测、agent循环优化，大幅提升模型推理速度
成熟度：底层工程架构完善，聚焦AI coding赛道，成为主流AI编程工具底层标杆

2.1.2 大厂 AI 应用整体成熟度

基础层：AI编码、UI生成、测试等工具化应用完全落地，成为研发标配
架构层：端云协同、Agent框架、工作流编排工程化成熟，大厂均自研核心框架
业务层：电商、内容、设计转码等场景规模化商用，直接提升业务效率
范式层：研发模式从人工编码转向AI辅助/AI自主执行，工程师角色向AI编排者转型
个体层：AI工具支撑超级个体/一人公司落地，创业成本与效率实现量级优化

2.2 一些金句

AI 的时代，编程的本质是从原来的手工时代到了工业化
大语言模型或生成式 AI 是优秀软件组织的能力放大器，也是组织能力的透视镜。
AI coding 飞奔猛进，但我们往往忽略了一个关键问题，为了保证这些 AI 生成代码的质量，当应用迭代全面提速的时候，谁来守护交付的稳定性？答案也许就是 AI 赋能的智能测试。
以前比拼谁的代码写得好、写得快，今天比拼谁能用好AI工具，谁更懂业务。
AI不会取代所有人，但会用AI的人一定会取代不会用AI的人。
放下焦虑，保持好奇心，相信你肯定会慢慢达到一个属于你自己的 AI 分身，它既能帮你干活，又能帮你学习，又能让你提高效率。
互联网软件正从传统记录型、协作型系统向 AI 自闭环的 agent 原生系统转变，最终用户使用的系统必须能被 AI 触达和操作，未来不能被 AI 触达的系统将被时代淘汰。
工程师要培养自己的通才能力，以后真的会变成UX，既有产品能力，又有设计能力，又有工程师能力。
从生成代码片段到直接交付可安装的产品，才是用户真正需要的价值。
我们要从写代码的人变成给AI提供好的工具、好的反馈的人。

三、分享精华

3.1 开场

开场前先放了一些视频，介绍了 AI 技术在软件测试、开发及个人发展等领域的应用与影响，主要讲：

然后由大会出品人介绍了本次内容，探讨 AI 对终端和编程领域的影响，介绍了终端发展的新趋势、机遇与挑战：

AI 带来的变革
- 编程时代转变：AI 作为新的生产力，使编程从手工时代进入工业化时代，未来比拼的是架构设计、业务理解和用户洞察能力，而非单纯的体力。
- 主题意义：今年大会主题 “AI 新” 预示着即将进入 AI 新时代，希望大家借助 AI 进行创新，为业务和产品创造价值。
冰与火的矛盾
- 传统交互被替代：传统的交互逻辑繁琐的增删改查正被 AI 自动化大规模替代，仅满足于页面功能接口调试的发展道路将越走越窄。
- 生成式 AI 重构人机交互：生成式 AI 重构了人机交互，从鼠标点击到手指触摸，再到对话式的 LUI 和意图识别，预示着未来很多 SaaS 产品将从 GUI 走向 CLI，所有应用都值得用 AI 重新定义和设计。
终端定义的变化
- 交互重构
  过去用户需点开多层菜单寻找任务，现在只需表达意图，终端就能自动调用组件完成任务，这要求从业者从执行设计稿的人转变为设计交互逻辑和流程的人。
- 终端拓展
  终端的边界从手机、汽车、穿戴设备拓展到机器人，不同终端带来新的交互和体验，交互方式从触控屏进化为全感官语音、手势甚至环境语义，具身智能使设备具备听见、看见和行动的能力。
- 算力下沉
  为了隐私和响应速度，大模型将从云端逐渐走向部分终端，如何管理端侧算力、优化模型加载是需要解决的硬核问题，终端未来将演进为上下文、端侧模型和用户体验的结合。
机遇与挑战门槛和角色的变化比拼能力转变：

驾驭未来
- 拥抱技术和用户：终端从业者一直拥抱最新技术，离用户近且懂体验，有能力完成完美转身。
- 成为驾驭者：与其担心被 AI 取代，不如成为驾驭者，会用 AI 且懂 AI 架构的人将取代不会用的人。

3.2 Agentic SDK 在阿里巴巴 AI 工程下的框架演进与实践

第一个分享，我去分会场看了阿里在 AI 工程框架建设方面的实践经验。看得出他们在这方面的思考很深，分享了一些 Agent 框架设计的方案。

总结：

3.3 Cursor大规模agentic编程系统的工程实践

第二个分享去主会场看了 Cursor 工程师介绍的 Cursor 的实现。

这个我还以为是分享怎么使用 Cursor 进行大规模开发的，结果发现是讲原理，对我有用的信息不是很大，适合正在做 Coding Agent 的。

总结：

3.4 从上下文工程到 AI-First Dev Workflow

主要分享了上下文工程实践和最近比较火的 Harness Engineering。

详细内容请见分享嘉宾整理的文章：

https://mp.weixin.qq.com/s/ERSjcq9YURHvlsdTUv_Paw

3.5 TGUI: 面向AIGC时代下的 GUI 框架

然后听了淘宝的工程师分享他们的 TGUI 框架，核心是如何渲染 AI 返回的内容为可交互的 UI。

3.6 Agent Skills的设计哲学和实战进化

下午第一场，看了宝玉分享的 Agent Skills。现场演示他的文章创作和 Skills 使用，喜欢这样的实操分享，比理论更容易复刻。

写作流程与技能运用
- Claude 写稿：使用 Claude Web 进行写作，通过 project 保存历史稿，可在 project instruction 中设置日志提示词和内置技能，按流程先分析再写作。
- 合并稿子技能：有专门合并稿子的技能，可从多份稿子中选一份最好的作为底稿，提取其他稿子优点，再合并、润色、格式化。
- 生成封面图与插图：可参考 YouTube 封面图生成文章封面图，为文章配图，开源项目中有相关技能，生成过程中需确认方案和风格。
- 利用 Gemini 提取字幕：使用 Gemini 的 GEM 功能，输入 YouTube 视频 URL 可自动分析字幕，识别发言人物并分段、分章节，为后续 AI 整理提供优质素材。
- 生成稿子示例：展示了已生成的稿子，包含章节目录、按章节展开内容及时间轴，主持人和嘉宾名字清晰，方便后续创作。
- 素材生成
- 写作工具与技能

技能创建与经验分享技能创建方式
提示词转化：将好用的提示词交给 skill Creator 可创建相应技能，如翻译提示词可创建翻译技能。任务抽象：基于与 AI 的对话和操作，提炼出通用技能，如自媒体介绍 AI 产品模型的技能。模糊想法引导：当想法模糊时，让 AI 采访提问，在回答过程中明确思路，创建技能。

技能使用经验
- 拆分小技能：避免创建超级技能，将写作流程拆分成多个原子小技能，如分析、写作、润色、发布、插图、封面图等，可重复使用，便于维护和聚焦任务。技能迭代：让 agent 分析技能问题原因并优化，如写作风格技能可通过对比修改版本，迭代出符合个人偏好的技能。
- 了解 agent 特点：agent 喜欢读写文件，可针对文件进行搜索、更新编辑；先全面分析再执行任务效果更好；告知 agent 验证方法可节省人工验证工作；使用子 agent 可提升效率；尽量不用 MCT，使用脚本更稳定、节约 TOKEN。