英伟达将用NTC技术让你的老N卡重获新生？

NANO140

951人浏览 · 2026-04-08 14:57:19

NANO140 · 2026-04-08 14:57:19 发布

1、啥是NTC？

神经纹理压缩 —— Neural Texture Compression (NTC)

英伟达的神经纹理压缩技术于2023年5月首次亮相，但过去几年中，英伟达对其进行了不断改进，最新版本更是令人印象深刻。在前不久的2026年的GTC大会上，英伟达解释了该技术如何利用机器学习来压缩纹理，在大幅减小文件大小的同时，保留最重要的视觉信息。当游戏需要时，运行在GPU上的小型神经网络会重新生成纹理。关键在于，NTC 技术是确定性重建，而非生成式 AI：运行在 GPU 上的小型神经网络每次都会生成完全一致的纹理，不存在 DLSS 这类超分技术的画面幻觉。

如上图，在GTC 2026 大会的一场技术演示中，NVIDIA 展示了其神经纹理压缩技术在某些场景下可将显存占用量从 6.5 GB 降低至仅 970 MB。演示视频对比了一座托斯卡纳别墅及其内部场景。在纹理外观几乎没有变化的情况下，神经纹理压缩技术在保持图形保真度的同时，释放 GPU 内存以支持更多游戏内容。

神经纹理压缩的工作原理是训练神经网络来理解纹理贴图的基本像素（纹素）在特定材质上的外观。NVIDIA 针对游戏中常见的 PBR 材质类型完成了模型训练，同时支持开发者针对特定材质做定制化微调，可直接集成到现有游戏管线中。该技术的核心是在保持纹理视觉效果一致的前提下，大幅降低显存与存储开销；部分场景下，模型还能基于潜在特征还原更细腻的材质细节，实现‘同显存下画质升级’。虽然目前还没有游戏开发商在公开版本中使用过NTC技术，但在内存短缺的情况下，任何能够减少游戏显存占用的技术都将是令人欣喜的消息。

该技术能够处理具有不同通道数据的复杂资源（例如纹理粗糙度或反射率），并能让纹理更合理地加载到显存中，从而在更小的空间内存储更多纹理。这也有助于缩小游戏安装包大小、减少补丁包体积并加快下载速度。考虑到现在有些游戏的大小超过 200GB，单凭这一点就足以带来显著的提升。

神经纹理压缩的核心思路非常简单：用一套跨所有材质通道共享的潜在表示（latent representation），替代传统按层存储的 PBR 纹理，再搭配一个在采样时运行的小型解码器网络。潜在表示以 2D 纹理形式存储，解码器在着色器中重建出材质属性（反照率、法线、粗糙度 / 金属度 / 环境光遮蔽等）。

神经纹理编码（Neural Texture Encoding）

核心设计约束是：潜在纹理会以标准 BC 压缩纹理的格式导出[1]。这一设计完整保留了渲染器所需的全部特性，包括随机访问、mipmap、各向异性过滤，以及与现有流加载（streaming）和驻留（residency）系统的兼容性。从引擎视角来看，神经纹理的行为与普通 BC 纹理完全一致，唯一的新增环节是着色阶段的轻量解码步骤，因此集成过程非常简便。

但需要注意：直接对学习得到的潜在空间进行压缩是不够的 ——BC 压缩产生的失真，会在运行时被神经解码器放大。

训练流程与原理

为了确保学习到的表示与运行时行为完全一致，训练过程会显式建模 BC 压缩：在训练图中直接模拟 BC 解码流程。因此，网络的优化目标是渲染器实际采样到的信号，而非训练后仅能被 BC 近似的未压缩神经特征。

过滤（Filtering）的处理逻辑完全相同：每个训练样本都携带连续的细节层次（LOD）值，监督信号由 GPU 采用的三线性（trilinear）或双三次（bicubic）过滤行为生成。这一设计让解码器隐式学习到了过滤操作本身。

运行时，渲染器通过硬件采样器对潜在 BC 纹理执行一次过滤采样，解码器直接从这些过滤后的特征中重建材质通道。最终输出在不同 mip 层级过渡、亚像素运动场景下都保持稳定，无需额外的后过滤步骤。

运行时重建（Runtime reconstruction）

运行时，潜在 BC 纹理会通过标准纹理管线完成采样。经过过滤的潜在特征，会被送入一个仅含单隐藏层的小型多层感知器（MLP）中 —— 该网络嵌入在像素着色器（Pixel Shader）或 G 缓冲器着色器（G-buffer Shader）内，用于重建材质属性。

解码器参数存储在小型常量缓冲区或纹理中，整个重建过程仅包含少量矩阵乘法运算。由于该表示原生兼容 BC 格式，因此集成到渲染管线的过程相对直接。

术语	解释
BC 压缩纹理	GPU 通用的块压缩纹理标准（BC1/BC3/BC7 等），硬件加速解压，是游戏行业主流纹理格式
潜在表示（Latent Representation）	神经网络学习到的低维特征，非原始像素，是压缩的核心载体
MLP（多层感知器）	小型神经网络，这里是单隐藏层的轻量解码器，负责从潜在特征重建材质属性
G-buffer（几何缓冲）	延迟渲染管线中存储场景几何 / 材质信息的缓冲区，用于后期光照计算
各向异性过滤	GPU 纹理过滤技术，提升斜向视角下的纹理清晰度
mipmap	纹理多分辨率层级，适配不同渲染距离，避免纹理闪烁

上面叨叨了这么多，说人话就是：

本质上来说，神经压缩（neural compression） 并不是依靠一套固定的算法来计算最佳的压缩方式，而是在推理阶段（inference time） 由一个小型 AI 来 “看图说话”。它会得出这样的结论：“哦，这个颜色贴图（colour map）上有一道划痕，那凹凸贴图（bump map）上肯定也得有这道划痕，我们完全可以用这同一个特征来同时表示两者。”

通过反复进行这样的学习，它不再像传统方式那样分别加载纹理贴图、凹凸贴图、着色器、高光贴图、污渍贴图、污渍遮罩等一堆文件，而是将这些所有纹理的知识信息，都迁移（transfer） 到一张 “潜在贴图（Latent map）” 上。游戏运行时，实际加载的就是这张潜在贴图。

在游戏渲染时，再也不需要把之前那一堆贴图全部解压了。相反，只需要去查询那个 MLP（多层感知器）—— 它就像一个托管着 “潜在图像” 的微型解码器（MLP） —— 问它：“这个像素该是什么颜色？” 它能立刻给出答案，因为答案早就存在于那个潜在图像里了。

从本质上讲，这就变成了 “加强版二维码”：你只要对着它 “拍照”（读取像素），就能直接拿到完整的 “网站”（完整的材质属性数据【含反照率、法线、粗糙度等 PBR 通道】）。

是的，这是一种有损压缩格式（lossy format），推理过程必然会产生一定损耗。但根据具体使用场景的不同，这种损耗你很可能根本察觉不到。

	文中内容	通俗解释
	固定算法	传统 BC/ASTC 压缩：用数学公式硬算，不懂纹理 “是什么”，只能压缩像素。
	推理阶段	指游戏运行时，玩家玩游戏的那一刻，AI 在显卡里 “脑补” 出细节。
	潜在贴图	压缩的核心：一张包含了所有 PBR 纹理核心信息的 “特征图”。体积极小，是传统纹理的 1/10 甚至更小。
	多层感知器	解码器：一个极小的 AI 模型（几 KB），记住了如何把 “潜在贴图” 还原成真实纹理。
	加强版二维码	形象的比喻：二维码存网址，扫一下出网页；NTC 存 “纹理特征”，读一下出完整材质。
	有损压缩	压缩后会丢失极少量肉眼难察的细节，但换来了 80%+ 的体积缩减。

2、英特尔也在行动！

在 NVIDIA NTC 之外，英特尔同样入局神经纹理压缩领域，于 2026 年 GDC 正式发布Texture Set Neural Compression（TSNC，纹理集神经压缩），并推出面向开发者的完整 SDK。

该技术能够将纹理体积缩小至原来的 1/18，同时保持视觉质量，与行业标准压缩相比，几乎没有可察觉的差异。英特尔的图形团队利用基于人工智能的神经网络，处理来自行业标准 BCN 纹理的输入数据。这些纹理首先通过人工智能模型编码器进行压缩，然后以最新的空间值进行编码，最后由网络解码器进行解码以解压缩。最终输出的纹理数据体积缩小至原来的 1/18，即使在最大压缩设置下，质量也会有所损失。与任何神经网络技术一样，TSNC 也需要使用数百万个标准化纹理进行训练，以创建一个能够替代传统 BCN 格式压缩纹理的人工智能模型。这使得游戏纹理体积更小，加载速度更快，占用更少的显存，并且得益于现代 GPU 技术，性能也更出色。

英特尔为 TSNC 设计了两套运行模式，覆盖从高保真到极致压缩的全场景需求：

Variant A（质量优先）压缩比：9×感知质量损失：约 5%适用：主机、PC 高端 3A、影视级实时渲染
Variant B（压缩优先）压缩比：最高 18×感知质量损失：6%–7%适用：云游戏、移动端、包体极致优化场景

相比传统 BC 压缩约 4.8 倍的压缩效率，TSNC 在同等画质下实现效率翻倍，极限模式更是将纹理体积压缩至原来的 1/18。

英特尔使用搭载 Arc B390 集成显卡的最新“Panther Lake”系统对其纹理集神经压缩技术进行了基准测试。该系统还包含 XMX 核心，可无缝加速这些技术。人工智能模型生成第一个纹理像素仅需约 0.194 纳秒，速度之快足以让用户感觉不到任何额外的延迟，也不会在游戏渲染中遇到任何异常。预计这项技术将于今年晚些时候以 alpha 版本发布，随后还将推出 beta 版和正式稳定版，但目前尚未公布具体时间表。