想一想这么一个场景,你对AI说:“我想看算泥公众号最新10篇文章”。然后手机就能实时按照你最习惯阅读的方式将算泥最新10篇文章发给你。

这不是科幻,已经在路上了。

Google DeepMind 发布了一款仅凭一句话就能实时生成整个网站的实验性浏览器。

名为 Flash-Lite Browser 的应用,彻底抛弃了预设网页的传统逻辑,利用 Gemini 3.1 Flash-Lite 模型实时编写代码,为用户呈现完全定制化的交互界面。

网页现场写给你看

打开 Flash-Lite Browser,你看到的界面与普通浏览器差不多。不同之处在于,顶部的地址栏变成了一个纯粹的输入框。你完全不需要输入任何网址,只需直接用自然语言,告诉机器你想看什么内容。

浏览器里看到的所有网站,都并非真实存在。每一个像素,每一行代码,全部由大语言模型从零开始,实时生成。

在演示视频中,用户在输入框里敲下了一句“a guide to watering my cheese plant”(龟背竹浇水指南)。

浏览器瞬间开始流式输出代码,并同步渲染。短短几秒钟内,结构完整的网页就出现在屏幕上。

页面顶端有着清晰的导航栏,侧边配有精致的图标,主体内容采用分栏布局,关于龟背竹的浇水频率、温度要求、土壤检查等专业知识一应俱全。

在传统的软件开发流程中,搭建同样的页面需要经过线框图设计、视觉排版、前端代码编写以及多端测试,整个周期可能长达数天。如今,AI几秒钟生成。

负责项目的工程师解答了背后的技术原理。

搜索框背后根本没有任何传统的搜索功能。系统仅仅是将当前页面的状态和用户输入的文本,一起发送给模型。模型通过理解上下文,推断出接下来应该展示什么内容,并重写完整的网页代码,来构建下一步的交互场景。

用户在页面上的每一次点击,每一次键盘输入,都会触发模型重新生成整个页面的底层代码。

系统里没有任何预先生成的数据,也没有历史记录可以调用。模型完全依靠当前页面的视觉元素和用户的交互意图,推理出下一个页面的具体模样。

完整的多页面网站,从最初的意图识别到最终的视觉渲染,全程保持实时动态生成。

为了展示创造力,工程师测试让其生成“the most annoying website on the internet”(互联网上最烦人网站)。

系统精准地捕捉到了烦人概念的精髓。屏幕上立刻渲染出写着欢迎来到混乱的页面。整个页面被红色的虚线边框包裹,正中央突兀地摆放着写有有种就点我的绿色大按钮,顶部还悬挂着一条紫色的横幅,严厉警告用户不要点击任何东西。

页面在代码生成的过程中就已经开始同步渲染。用户在视觉上感知到的等待延迟,远远低于模型实际生成全部代码所需的时间。

工程师提及,假设开发者追求更加精细和复杂的 UI,可以切换使用性能更强的 Pro 或 Flash 模型。但在要求极速响应的实时交互场景下,Flash-Lite 版本的速度优势实在无可匹敌。

支撑实时生成体验的核心引擎,是 Google 在2026年3月初刚刚进入预览阶段的 Gemini 3.1 Flash-Lite 模型。作为 Gemini 3 系列中速度最快、成本最低的成员,该模型专门为需要极低延迟和高吞吐量的任务而生。

告别预设的界面

前沿技术突破触及了人机交互的本质。

人类整整花了40年的时间,才给冰冷的计算机套上了直观易懂的 GUI(图形用户界面)。过去,人类必须通过点击按钮、拖拽滚动条、填写表单,来操控计算机。

GUI 一直是横亘在人类意图和机器指令之间的翻译层。因为人类无法直接书写二进制代码,必须借助图形界面作为拐杖。

传统的 Web(万维网)生态完全建立在预先设计的基础之上。开发者需要提前用 HTML、CSS 和 JavaScript 写好每一行代码,并将代码部署到云端的服务器上。

用户在浏览器中输入网址发起请求,服务器再将静态文件或动态拼接好的页面返回给用户。整个互联网的运作前提,是必须有人提前把界面设计好。

Flash-Lite Browser 彻底颠覆了延续数十年的传统。

网页彻底告别了从遥远服务器取回现成物品的旧模式。它变身成了专门为你当场编写的专属定制品。GUI 连被预先设计的前提都不再需要了。

伴随着智能体技术的成熟,机器与机器之间的沟通完全可以直接使用 CLI 或 API。Agent 根本不需要为了美观去解析复杂的网页布局。

GUI 的角色发生了完全的反转。过去是人类操作 GUI 去指挥计算机办事。未来将是 AI 生成 GUI 来向人类展示信息。

大模型充当了完美的翻译官,将模糊的自然语言需求,瞬间转化为严谨的计算机代码。

随时定制的未来

静态网页时代或许正在迎来终结的倒计时。当界面可以根据用户的实时需求瞬间生成时,互联网的信息组织方式将发生根本性的改变。

设想日常的在线购物场景。在传统的电商网站中,你需要穿梭于固定的商品分类,使用统一的筛选面板,忍受千篇一律的商品详情页。

在生成式 UI 的世界里,你只需告诉 AI 你要为一家4口的雨季露营采购装备。AI 会立刻为你量身定制一个专属的电商界面。

屏幕上不仅会展示防雨帐篷和防水靴,还会贴心地生成一个对比表格,将不同产品的防水指数和重量直观地呈现出来。当你完成采购关闭窗口,专属界面就会永远消失。它仅仅为了那一刻的需求而存在。

同样的信息源,在不同用户面前会呈现出完全不同的样貌。

假设你想阅读某个公众号最新发布的10篇文章。你只需直接对 AI 说出诉求。AI 会在几百毫秒内去后台获取数据,用你最习惯的阅读排版方式,为你实时渲染出专属的阅读界面。

老年人可能会看到字体硕大、对比度极高的极简界面。数据分析师可能会看到自动提取了核心数据的图表展示。

同一个信息源,在10000个不同的用户面前,可以有10000种截然不同的呈现方式。

开发者的工作模式也将随之重塑。

企业不再需要维护庞大且臃肿的前端代码库。产品团队只需定义好核心的业务逻辑和数据接口,将界面的渲染工作全权交给 AI 去实时完成。

从脑海中的模糊想法,到屏幕上可点击的交互原型,中间的距离被压缩到了短短几秒钟。

技术总是在不知不觉中跨越临界点。

当代码的生成速度快过页面的加载速度时,网页浏览的定义就已经被悄然改写。

我们正在见证全新互联网生态的雏形。在全新的生态里,每一点好奇心,都会瞬间绽放成只为你存在的世界。

参考资料:

https://aistudio.google.com/apps/bundled/flash_lite_browser

https://x.com/GoogleDeepMind/status/2036483295983100314

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐