大家好,我是拭心。

2026 年 3 月 21 日, 第 20 届 D2 技术大会顺利落幕,参会人有 2000+,非常热烈。

我带着“看看大厂都在用 AI 做什么”的目的参会,一天下来,有蛮多收获。

在此记录一些个人觉得有价值的信息,希望对你有帮助。

图片

一、会议信息

D2 官网:  https://www.d2conf.com/

过去的一年里,“AI 会不会取代程序员”“前端还有没有未来”“终端是不是要消失了”这样的讨论此起彼伏。技术范式在快速更迭,焦虑是真实的,但机会同样也是。

D2 一如既往地选择和终端开发者站在一起,用一次扎实的线下大会,和大家一起面对 AI,理解 AI,用好 AI。直面AI技术带来的挑战,把握AI创新打造的机遇。

本次会议的精彩图片:https://v.pixcheese.com/s/5XbTNgz6v5j

会议内容:

图片

二、精华总结

2.1 大厂都在用 AI 做什么

2.1.1 各厂具体 AI 落地程度

阿里巴巴:开发了 AI 工程框架&多 Agent 体系落地

  • 自研了一个  AI Engine 应用开发框架 +统一AI网关,支持异构模型、流式异步、GPU弹性伸缩

  • 落地了三种工作流(fix/AI enable/agent workflow)+多智能体模式(指挥官/network/团队模式)

  • 应用于 电商商品生成、数据分析、供应链备货、营销业务 等场景

  • 成熟度:历经3年迭代,从模型开发升级至高代码应用框架,电商场景规模化商用

淘宝:开发了一个 TGUI 框架, AIGC 交互框架+AI研发提效

  • 打造TGUI框架,解决AI生成内容的可交互UI渲染,优化解析/渲染/展示性能

  • 实现端侧MCE能力,让AI操盘APP,通过降级+流式修复解决大模型幻觉

  • 成熟度:构建AI生成UI的标准化底座,替代传统Markdown渲染,适配电商复杂交互场景

腾讯音乐(TME):开发了复杂的 D2C 平台,设计稿转码AI精准协同

  • 通过算法清洗设计稿、人工介入引导,解决大模型TOKEN膨胀与幻觉问题

  • 实现图层清洗、空间推理/粗分、组件复用、多端转码、局部变更推理

  • 开发插件系统支持国际化、颜色TOKEN等定制化诉求,落地飞书插件、CR应用

  • 成熟度:工程化深度落地,解决设计稿转代码的还原度、工业化适配难题,达到商用级精度

天猫:实现了团队级 AI 全栈研发解决方案

  • 建立AI编码离线评测+漏斗追踪系统,知识物料采纳率从18%提升至35%

  • 通过四层代码物料注入,AI代码产量率从76%提升至近98%

  • 接入Chrome CDP协议赋予AI调试能力,简化研发流程,新人环境搭建从2小时缩至30秒

  • 成熟度:完成团队级AI研发体系搭建,覆盖编码、调试、流程自动化,进入规模化推广阶段

千问硬件:展示了端侧 AI 交互+AI Coding Agent

  • 落地AI眼镜端侧交互,实现提词、实时信息辅助等功能

  • 成熟度:端侧AI硬件实用化

Cursor:分享了大规模 Agentic 编程系统工程是如何优化的

  • 实现端云分离架构,适配多客户端、灵活切换模型、便捷AB测试

  • 通过HTTP2、TOKEN预测、agent循环优化,大幅提升模型推理速度

  • 成熟度:底层工程架构完善,聚焦AI coding赛道,成为主流AI编程工具底层标杆

2.1.2 大厂 AI 应用整体成熟度

  • 基础层:AI编码、UI生成、测试等工具化应用完全落地,成为研发标配

  • 架构层:端云协同、Agent框架、工作流编排工程化成熟,大厂均自研核心框架

  • 业务层:电商、内容、设计转码等场景规模化商用,直接提升业务效率

  • 范式层:研发模式从人工编码转向AI辅助/AI自主执行,工程师角色向AI编排者转型

  • 个体层:AI工具支撑超级个体/一人公司落地,创业成本与效率实现量级优化

2.2 一些金句

  • AI 的时代,编程的本质是从原来的手工时代到了工业化

  • 大语言模型或生成式 AI 是优秀软件组织的能力放大器,也是组织能力的透视镜。

  • AI coding 飞奔猛进,但我们往往忽略了一个关键问题,为了保证这些 AI 生成代码的质量,当应用迭代全面提速的时候,谁来守护交付的稳定性?答案也许就是 AI 赋能的智能测试。

  • 以前比拼谁的代码写得好、写得快,今天比拼谁能用好AI工具,谁更懂业务

  • AI不会取代所有人,但会用AI的人一定会取代不会用AI的人。

  • 放下焦虑,保持好奇心,相信你肯定会慢慢达到一个属于你自己的 AI 分身,它既能帮你干活,又能帮你学习,又能让你提高效率。

  • 互联网软件正从传统记录型、协作型系统向 AI 自闭环的 agent 原生系统转变,最终用户使用的系统必须能被 AI 触达和操作,未来不能被 AI 触达的系统将被时代淘汰。

  • 工程师要培养自己的通才能力,以后真的会变成UX,既有产品能力,又有设计能力,又有工程师能力。

  • 从生成代码片段到直接交付可安装的产品,才是用户真正需要的价值。

  • 我们要从写代码的人变成给AI提供好的工具、好的反馈的人

三、分享精华

3.1 开场

开场前先放了一些视频,介绍了 AI 技术在软件测试、开发及个人发展等领域的应用与影响,主要讲:

图片

然后由大会出品人介绍了本次内容,探讨 AI 对终端和编程领域的影响,介绍了终端发展的新趋势、机遇与挑战:

  • AI 带来的变革
    • 编程时代转变:AI 作为新的生产力,使编程从手工时代进入工业化时代,未来比拼的是架构设计、业务理解和用户洞察能力,而非单纯的体力。

    • 主题意义:今年大会主题 “AI 新” 预示着即将进入 AI 新时代,希望大家借助 AI 进行创新,为业务和产品创造价值。

  • 冰与火的矛盾
    • 传统交互被替代:传统的交互逻辑繁琐的增删改查正被 AI 自动化大规模替代,仅满足于页面功能接口调试的发展道路将越走越窄

    • 生成式 AI 重构人机交互:生成式 AI 重构了人机交互,从鼠标点击到手指触摸,再到对话式的 LUI 和意图识别,预示着未来很多 SaaS 产品将从 GUI 走向 CLI,所有应用都值得用 AI 重新定义和设计。

  • 终端定义的变化
    • 交互重构

      过去用户需点开多层菜单寻找任务,现在只需表达意图,终端就能自动调用组件完成任务,这要求从业者从执行设计稿的人转变为设计交互逻辑和流程的人

    • 终端拓展

      终端的边界从手机、汽车、穿戴设备拓展到机器人,不同终端带来新的交互和体验,交互方式从触控屏进化为全感官语音、手势甚至环境语义,具身智能使设备具备听见、看见和行动的能力。

    • 算力下沉

      为了隐私和响应速度,大模型将从云端逐渐走向部分终端,如何管理端侧算力、优化模型加载是需要解决的硬核问题,终端未来将演进为上下文、端侧模型和用户体验的结合。

  • 机遇与挑战门槛和角色的变化比拼能力转变:

    图片

    • 驾驭未来
      • 拥抱技术和用户:终端从业者一直拥抱最新技术,离用户近且懂体验,有能力完成完美转身。

      • 成为驾驭者:与其担心被 AI 取代,不如成为驾驭者,会用 AI 且懂 AI 架构的人将取代不会用的人。

    3.2  Agentic SDK 在阿里巴巴 AI 工程下的框架演进与实践

    第一个分享,我去分会场看了阿里在 AI 工程框架建设方面的实践经验。 看得出他们在这方面的思考很深,分享了一些 Agent 框架设计的方案。

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    总结:

    图片

    3.3 Cursor大规模agentic编程系统的工程实践

    第二个分享去主会场看了 Cursor 工程师介绍的 Cursor 的实现。 

    这个我还以为是分享怎么使用 Cursor 进行大规模开发的,结果发现是讲原理,对我有用的信息不是很大,适合正在做 Coding Agent 的。

    图片

    图片

    图片

    图片

    总结:

    图片

    3.4 从上下文工程到 AI-First Dev Workflow

    主要分享了上下文工程实践和最近比较火的 Harness Engineering。

    图片

    图片

    图片

    图片

    详细内容请见分享嘉宾整理的文章:

    https://mp.weixin.qq.com/s/ERSjcq9YURHvlsdTUv_Paw

    3.5 TGUI: 面向AIGC时代下的 GUI 框架

    然后听了淘宝的工程师分享他们的 TGUI 框架,核心是如何渲染 AI 返回的内容为可交互的 UI。

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    3.6 Agent Skills的设计哲学和实战进化

    下午第一场,看了宝玉分享的 Agent Skills。 现场演示他的文章创作和 Skills 使用,喜欢这样的实操分享,比理论更容易复刻。

    图片

    • 写作流程与技能运用
      • Claude 写稿:使用 Claude Web 进行写作,通过 project 保存历史稿,可在 project instruction 中设置日志提示词和内置技能,按流程先分析再写作。

      • 合并稿子技能:有专门合并稿子的技能,可从多份稿子中选一份最好的作为底稿,提取其他稿子优点,再合并、润色、格式化。

      • 生成封面图与插图:可参考 YouTube 封面图生成文章封面图,为文章配图,开源项目中有相关技能,生成过程中需确认方案和风格。

      • 利用 Gemini 提取字幕:使用 Gemini 的 GEM 功能,输入 YouTube 视频 URL 可自动分析字幕,识别发言人物并分段、分章节,为后续 AI 整理提供优质素材。

      • 生成稿子示例:展示了已生成的稿子,包含章节目录、按章节展开内容及时间轴,主持人和嘉宾名字清晰,方便后续创作。

      • 素材生成
      • 写作工具与技能

    图片

    • 技能创建与经验分享技能创建方式

      提示词转化:将好用的提示词交给 skill Creator 可创建相应技能,如翻译提示词可创建翻译技能。任务抽象:基于与 AI 的对话和操作,提炼出通用技能,如自媒体介绍 AI 产品模型的技能。模糊想法引导:当想法模糊时,让 AI 采访提问,在回答过程中明确思路,创建技能。

    图片

    • 技能使用经验
      • 拆分小技能:避免创建超级技能,将写作流程拆分成多个原子小技能,如分析、写作、润色、发布、插图、封面图等,可重复使用,便于维护和聚焦任务。技能迭代:让 agent 分析技能问题原因并优化,如写作风格技能可通过对比修改版本,迭代出符合个人偏好的技能。

      • 了解 agent 特点:agent 喜欢读写文件,可针对文件进行搜索、更新编辑;先全面分析再执行任务效果更好;告知 agent 验证方法可节省人工验证工作;使用子 agent 可提升效率;尽量不用 MCT,使用脚本更稳定、节约 TOKEN。

    图片

    3.7 AI与超级个体

    然后听了玉伯分享创业经验,久闻大名,今天终于见到了真人,没有想象中那么严肃。

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    3.8 从LLM幻觉到精准受控:TME在D2C推理协同上的深度实践

    这场分享的感觉就俩字:佩服。

    针对 D2C 做了非常多的工作,从算法到视觉到模型,叹为观止,大工程。

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    3.9 天猫AI全栈交付实践:从个人工具到团队研发提效解决方案

    这场分享很有落地价值,主要讲了如何让团队的知识沉淀和迭代。

    图片

    图片

    图片

    图片

    图片

    图片

    图片

    好了,以上就是这次大会觉得不错的内容。

    周六听完分享,觉得有太多收获,值得反复学习,于是周日花了一天整理这篇文章,希望对你有帮助。

    我是拭心,AI 技术专家,谷歌开发者专家和 TRAE 社区专家,长期关注 AI 技术变革和对程序员的影响。

    我创建了一个转型 AI 应用开发专栏,欢迎了解:《转型 AI 工程师|提升竞争力》

    Logo

    AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

    更多推荐