摘要: Meshy.AI创始人胡渊鸣在访谈中分享了AI原生游戏的技术选型思路:bridged world model(AI+经典图形学混合)比纯神经网络方案更现实落地。


访谈来源B站红杉会《prompt》,共88分钟,以下内容基于Ai好记转录的图文笔记提炼,方便快速抓住技术要点。在这里插入图片描述


1. 先说结论:纯神经网络做world model目前不现实

胡渊鸣直接给了数字对比:

  • 纯diffusion/autoregressive world model,单帧推理需要 1000+ TFLOPs
  • iPhone 17的NPU大约 30-40 TOPS,实际可用几TOPS
  • 差了 两个数量级,摩尔定律拉不平

结构性问题是:纯pixel-based world model要花大量算力理解基础物理。比如相机旋转360度后人物还在原位——这种事对传统渲染引擎很简单,对纯神经网络来说要消耗巨量参数。


2. 解法:bridged world model

胡渊鸣提出的方案是混合模型:

  • 经典图形学引擎 处理基础物理和渲染(相机运动、碰撞检测、光照)
  • 生成式AI 负责交互差异性和内容生成(每次体验不同)

好处是:基础渲染走传统管线保证60FPS实时性,AI只在需要"生成差异性"的地方介入,算力需求大幅降低,手机端可落地。

他做了一个类比——现在做coding agent,也是让LLM生成代码(中间表示),再用最廉价的方式执行。不是让LLM直接解决所有问题。游戏里bridged world model是同样的思路:AI生成中间表示,经典引擎负责执行。


3. AI原生游戏的两个判定标准

条件一:去掉AI,这个游戏没法玩。 AI是核心机制,不是锦上添花。换成随机数生成器或预设脚本,体验崩塌。

条件二:AI的加入让游戏更好玩。 不是为了用AI而用AI。如果AI破坏了传统游戏已有的好玩要素,那是减分。

他举了《黑箱》——攻击技能和交互方式完全由AI生成。每次合成武器时,玩家期待一个"意料之外、情理之中"的结果。


4. AI给游戏带来的三个要素

要素 说明
意料之外 每次结果不同,带来惊喜感
情理之中 玩家有参与感和控制权,不是纯随机
降低门槛 大语言模型用自然语言训练,0-99岁都能直觉交互

第三点很关键。传统游戏需要玩家学复杂操作,AI原生游戏可以用自然语言描述意图。设计难点从"教会操作"变成了"设计好的交互反馈"。


5. 方法论:怎么做AI原生游戏

三步走:

第一步:分析历史上成功游戏的特性。 挑战感、心流、成就感、探索欲。

第二步:找到AI能"彻底打开限制"的环节。 不是所有环节都需要AI。找到没有AI时受限、有了AI后彻底突破的玩法。比如构建系统、武器合成、NPC交互。

第三步:目标是做出99分的游戏,不是1万个60分的。 游戏市场赢家通吃。AI应该用来做一款极致的产品。

“你生成1万个60分的游戏没有任何意义,因为大家永远会去玩1个90分的游戏。”


6. 技术背景创始人的产品转型

Meshy的转型来自一个用户反馈:

“你把这个软件卖给我们,我们不会付钱。但如果你把软件里的3D资产卖给我,我可能愿意付5块钱。”

团队意识到:用户不关心你用了什么技术,只关心能解决什么问题。 结合Stable Diffusion和ChatGPT的浪潮,转向AI生成3D模型。

结果:过去12个月营收增长14倍,近4000万美金ARR,月增20%。

胡渊鸣说技术型创始人最大的陷阱是"总觉得自己技术够好产品自然有人用"。需要不断和真实世界碰撞。


7. AI不可替代的能力

  • 能替代的: 基于训练数据的所有任务。有数据集就能训练模型。
  • 不能替代的: 探索全新事物的能力。没人做过的事没有训练数据,需要"灵光一闪"——逻辑推理、感性飞跃、直觉去预测未来。

他用了一个词:think out of the box。在已有范式下思考全新的对未来的想象,是现在的AI不具备的。

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐