金鑫博士

华为云视频生成大模型、世界模型 团队主管

中国科学院计算技术研究所 博士 | 华为技术有限公司 2012实验室 / 华为云
华为云盘古多模态大模型首席架构师 · 华为技术专家A

📧 sdjinxin@gmail.com🏢 华为云

20 顶会/顶刊论文

60+ 专利申请

8 美国授权专利

10年+ 华为工作经历

关于我

我是金鑫博士,2015年毕业于中国科学院计算技术研究所(计算机软件与理论方向),同年加入华为技术有限公司,先后任职于2012实验室与华为云。

目前专注于大模型、人工智能与云计算领域,负责华为盘古视频生成基础模型、自动驾驶世界模型、具身世界模型、3D大模型、AR/VR、视频分析、OCR、机器学习平台、机器翻译等多个系统和服务。

担任华为集团级大模型项目"4野15纵"视频生成技术负责人、华为集团级天水计划-AIGC视频创意生成项目经理。技术成果于2023、2024、2025连续三年由华为云CEO在HDC/HC大会Keynote重磅发布。

核心专长:多模态大模型架构设计 · 视频生成与世界模型 · 3D/4D空间智能 · 自动驾驶仿真 · 具身智能数据合成 · 机器人· 视觉与AR算法

研究方向

视频生成

盘古视频生成基础模型

文生/图生视频、首帧生视频、首尾帧生视频、LoRA特效、视频编辑与续写。25年7月SuperCLUE国内第四,多项指标达到业界SOTA水平。突破万兴等X千万级/年客户。

自动驾驶

自动驾驶世界模型

视频生成、3D激光雷达点云生成、4D世界模型与闭环仿真、CODA榜单第一名。支撑广汽等X千万级客户,获数字中国峰会创新大赛二等奖。

具身智能

具身世界模型、VLA、WAM

动作控制图生视频、交互式视频渲染、端到端闭环仿真。构建6条具身数据合成管线。

4D空间智能

4D世界模型与3D重建

新视角视频生成、3D空间生成与实时漫游、3DGS重建。支持6DoF视角控制,PSNR>28,用于虚拟拍摄与具身场景复刻。

重点项目与发布

HDC 2025 盘古展台

HDC 2025

盘古 for 汽车 · 世界模型全链路仿真体系

在华为开发者大会2025展示盘古世界模型全链路一体化仿真体系,构筑智驾研发的"安全阀"和"加速器"。

HDC 2025 演讲

HDC 2025 技术解读

如何用世界模型重构物理世界

基于对世界的理解和预测演化出AI世界模型。多模态理解和生成是世界模型的基础,模态从1D语言演进到4D动态世界。

世界模型趋势

HDC演讲 技术演进

世界模型是全模态大模型发展的未来趋势

大模型技术演进路径:走向全模态、多任务支持、长CoT、机理+AI。物理世界的业务需求驱动自动驾驶与具身智能的数据合成和闭环仿真、WAM。

工作经历

华为云 · 历任大模型、3D、视觉算法团队主管2017.05 - 至今

华为技术专家A | 盘古多模态大模型首席架构师 | 视频生成与世界模型团队主管

  • 负责华为云盘古视频生成基础模型、自动驾驶世界模型、具身世界模型、4D世界模型、3D大模型、AR/VR等业务
  • 带领国内几十人、海外几十人团队,突破万兴、广汽、爱奇艺、国铁集团TFDS、德邦暴力分拣识别等千万级客户
  • 连续三年HDC/HC大会Keynote技术发布

华为2012实验室 · 高级算法工程师2015.07 - 2017.05

机器翻译、终端智能搜索、大数据并行分析

  • 机器翻译:基于TensorFlow优化RNN翻译模型,BLEU提升21%,速度提升一倍
  • 终端相册智能搜索:设计自然语言查询理解与图像语义搜索系统
  • 大数据并行分析:实现DBSCAN、FA等算法Spark分布式并行,加速比>0.7

中国科学院计算技术研究所博士 · 2015.07毕业

计算机软件与理论

论文与专利

📄

学术论文

在 IEEE Transactions、ICLR、CVPR、AAAI、IROS、ICDM、CIKM 等顶级期刊和国际会议发表论文 20篇,涵盖多模态大模型、计算机视觉、机器人与智能系统等领域。

🔒

发明专利

申请美国、欧洲、中国专利 60+项,其中已授权美国专利 8项。涉及视频生成、世界模型、3D重建、OCR、视觉搜索等核心技术。

荣誉奖项

🏆

总裁嘉奖令

多次获得华为公司总裁嘉奖令

🎖️

战时英雄连

华为政企业务部战时英雄连(2021)

🏅

战略贡献奖

华为中国区战略目标奖

🎯

华为产品与解决方案竞争力奖

以及 优秀绩效管理团队

iF 设计奖

油气AR巡检项目获国际iF设计奖

📊

数博会优秀科技成果奖

大数据与人工智能领域

© 金鑫博士 | 华为云盘古视频生成&世界模型

- 个人官网:https://jinxindeep.github.io/

- 技术博客:https://blog.csdn.net/sdlcjx

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐