数字 vs. 模拟:为什么说AI计算正在“返祖”?

1948年9月,加州理工学院的传奇物理学家理查德·费曼刚写完他的著名论文《模拟与数字》,正好碰上冯·诺依曼来做一场题为“自动机通论”的讲座。两人展开了激烈的辩论,争论的焦点正是——未来的计算机,到底应该是数字的,还是模拟的?

那个时候,这个问题远没有答案。费曼对模拟机情有独钟。他在论文中提到,大约1/4到1/3的英美科学家在战时参与过模拟计算机——微分分析仪、射击指挥仪——的研制工作,这些机器用齿轮、杠杆和电压来模拟物理世界的连续变化。它们计算炮弹弹道、破解潜艇航迹,速度之快让当时的数字机望尘莫及。

而冯·诺依曼看到的则是模拟机的致命缺陷:精度。模拟量每经过一次处理,噪声就会累积;每多用一个元件,误差就会叠加。当系统的复杂度超过某个阈值,模拟机就会迷失在自己的噪声中。费曼本人也在论文中坦承了这一局限性——他称之为模拟计算的“本质属性”,一旦误差超出了某个临界范围,再复杂的系统也无法保证正确的输出。

最终,后世的教科书一致认定:冯·诺依曼赢了。

然而,这个故事在最意想不到的时间节点迎来了续集。2017年,当摩尔定律步履蹒跚、AI算力渴求新的出路,一篇《自然·光子学》封面论文提出了用光子神经网络执行深度学习的方法。这个方案,在本质上完全偏离了冯·诺依曼预设的数字轨道,反而回到了一条被尘封了半个多世纪的路径——模拟计算。这,就是一场静悄悄的计算哲学“返祖”。

一、数字与模拟的底层哲学:两种世界观的对话

“数字”与“模拟”之间的区别,根本上是信号的表示方式不同——一类将世界看作一串离散的符号,另一类则将世界看作连续的物理量。

数字计算处理的是离散量。它把真实世界的连续信号(声音、光线、温度)通过模数转换器(ADC)“采样”和“量化”,变成一串0和1的序列。其核心思路用简化的语言描述就是:计算机通过“近似成0和1”,用高度的抽象和规整来消除物理世界的不确定性,从而获得极强的可复制性和抗干扰能力。费曼早在1948年就指出,数字信号之所以能在长距离传输和多次复制中保持精度,正是因为它不依赖于信号的“精确值”,只取决于信号落在0还是1的判断区间。

模拟计算则与之截然相反——它处理的是连续量。模拟计算直接用物理量(电压、电流、光的强度或相位)的连续变化来表示数值并执行运算。现实的物理世界本质上正是连续的、模拟的。在这个意义上,当一个系统需要高频率地与现实世界交互——比如实时的信号处理、物理仿真——模拟机实际上比数字机更贴近问题的本质,处理效率也更高。

模拟计算的核心优势恰恰拴在了劣势的另一端:它天然并行、速度快、能耗极低——但代价是噪声敏感、精度低、难以编程。如费曼在1948年所述,模拟计算机通常用机械部件(如齿轮传动链、凸轮等)或电学元件(如电阻网络、电感电容等)组成。但无论何种实现,随着系统复杂度的上升,误差累积始终是一个悬而未决的根本性挑战。

为什么“数字”最终胜出? 因为数字电路能够重构信号:一个略微衰减的“0.9”,可以被门电路重新驱动成标准的“1”。这种“噪声免疫”特性,使得数字系统可以无限扩展复杂度而不至于崩溃。从晶体管的开关特性到布尔代数,从逻辑门到图灵机,整个数字大厦建立在0和1这两个离散状态的可靠性之上。冯·诺依曼架构选择了数字路线,是人类工程史上最务实的抉择之一。 但对于今天某些最关键的AI计算任务,这一抉择的代价正在变得越来越难以承受。

二、历史的判决:数字革命的盛世与隐患

1947年贝尔实验室发明点接触晶体管的同一年,冯·诺依曼在设计EDVAC计算机时做出了影响深远的体系结构决策:将程序指令与数据放在同一个存储器中。这个“存储程序”架构赋予了计算机“通用”的灵魂,也确立了数字路线在未来半个世纪的统治地位。

1965年,戈登·摩尔提出了那个著名的预测:集成电路上的晶体管数量大约每18-24个月翻一番。在随后的半个世纪里,整个半导体产业如同上紧了发条的时钟一样,遵循着这个节奏疯狂迭代——晶体管尺寸从微米级缩小到纳米级,芯片算力随之指数级攀升。

然而,这座数字大厦的地基上已经出现了裂痕。当晶体管沟道长度缩至几纳米时,量子隧穿效应开始变得不可忽视:电子如同拥有了“穿墙术”,直接隧穿通过本该绝缘的栅氧化层,导致无法关闭的泄漏电流,芯片的静态功耗由此急剧飙升。这意味着,即使晶体管还能做得更小,但芯片已经无法再像过去那样靠缩小尺寸来同步降低功耗了。学术界形成共识:后摩尔时代的集成电路特征尺寸已进入量子效应显著的范围,导致功耗密度快速上升。

与此同时,一种更深层的结构性缺陷——“内存墙”——开始浮出水面。当大模型进行万亿次浮点运算时,大量时间被消耗在芯片内外的数据搬运上。在运行大型神经网络时,超过60%的能耗并非花在“计算”本身上,而是花在将数据从内存搬运到处理器的路上,这已成为制约AI芯片性能的致命瓶颈。

于是,一个关于“返祖”的问题悄然浮现:如果我们暂时放弃对“完美0/1”的执念,接受一定程度的噪声,能否换来数量级的能效与速度提升?

三、大脑的启示与模拟派的“秘密武器”

这并非天方夜谭。大自然已经给出了一个极为成功的“模拟计算”范本——人脑

人脑拥有约860亿个神经元、超过100万亿个突触连接,能够实时处理极其复杂的视觉、听觉和决策任务。整个大脑的功耗仅有约20瓦——相当于一个节能灯泡。而训练一个GPT-4级别的大模型,电力消耗以百万瓦计。

大脑的高效秘诀何在?

首先,大脑天然地实现了存算一体。记忆和计算存储在同一个物理介质——突触连接强度——上,不存在冯·诺依曼架构中数据在存储器和处理器之间频繁搬运的能耗开销。

其次,大脑采用模拟信号处理。神经元通过脉冲频率(而非精确的电压值)来编码信息,本质上是一种模拟-数字混合编码。信息以脉冲序列的“速率”为载体传播,这种编码方式天然对精确的电压噪声有一定容忍度。这种生物学的“存内计算”思想,直接催生了人工神经网络中的忆阻器存算一体技术,它将“智能电阻”组成物理矩阵,从而在模拟域中完成矩阵运算。

第三,神经元能够在极低电压下工作,单次“计算”的能耗仅为飞焦级别,比最先进的晶体管开关还要低几个数量级。

这个大脑范本至少证明了一点:模拟信号处理,完全有能力支撑极其复杂的智能任务。 它只是对噪声的处理方式不同:不是消灭噪声,而是容忍、容纳并利用噪声。这个哲学上的转变,正是从费曼那一代开始,经过冯·诺依曼一代的放弃,最终又在大模型时代重新被唤醒的核心线索。

四、模拟派的两大看家本领:存算一体与低精度推理

存算一体(In-Memory Computing) 是模拟派的第一张王牌。其核心思想极为朴素:既然数据搬运消耗了绝大部分能量,为什么不把计算电路直接嵌入存储器内部?一些新型存储器件(如阻变存储器RRAM和自旋转移矩磁性存储器STT-MRAM)在阵列中直接完成了模拟域的核心计算——矩阵乘加运算(Multiply-Accumulate, MAC)——通过“电阻×电流 = 电压降”这一基本物理定律,将乘法运算“免费”地执行在了存储器阵列的物理结构上,从而绕过了传统架构中最为耗时的数据搬运环节。

低精度推理是模拟派的第二张王牌。传统数字AI芯片使用FP32(单精度浮点)甚至更高的精度来保证计算精度。然而,越来越多的研究者发现,对于神经网络推理任务而言,8位整数(INT8)甚至4位的低精度计算,往往足以维持几乎相同的预测准确率,而能效却可以提升一个数量级以上。

其底层原因在于:神经网络的推理过程天然具有容错性。单个权重或中间激活值的一点点误差,对最终分类结果的影响往往是微不足道的——因为网络的最终输出取决于大量神经元的统计性投票,而非某一个精确数值。这种“天生不怕噪声”的特性,与模拟计算的“弱点”恰好形成了抵消效应。模拟计算的误差多为随机分布,而神经网络的统计性处理天然能够容忍这部分随机噪声。

这正是安克创新Thus™芯片能在耳机这样功耗极致敏感的场景中实现AI语音降噪的根本逻辑:它采用了模拟存算一体架构,以4-8位的低精度来完成音频推理,在这种“够用即可”的任务上,模拟方案对数字方案有着压倒性的能效优势。

五、光模拟计算:终极的“物理计算”形态

将这一思路推向极致,就进入了光子计算的疆域。

马赫-曾德干涉仪(MZI)微环谐振器(MRR) 是光模拟计算中最核心的两个片上器件。MZI利用两束光之间的干涉效应实现可调控的乘加运算,MRR则像一个“可调光阀”,能根据权重精确控制特定波长光信号的通过比例。光的矩阵乘加运算在物理传播过程中只需皮秒级的时间即可完成——本质上是被动物理过程,本身就近乎零能耗。

这种“速度+低功耗”的组合优势,使得光计算在特定AI推理任务中可以做到毫瓦级功耗、纳秒级延迟完成一次矩阵乘法。

但它的软肋同样来自其最大特点:模拟噪声。光子在波导中传输时虽然热噪声极低,但光子器件的制造存在工艺偏差,环境温度变化也会导致波导折射率漂移,这些因素限制了矩阵运算的有效位数。中国信通院2025年的报告明确写道:“光计算在硬件层面仍面临设计成熟度低、集成难度大、系统规模小三大挑战。”

这就解释了目前产业的真实定位:光计算的目标并不是取代CPU或GPU,而是作为一个专用的AI加速协处理器,承担神经网络推理中计算量最大但精度要求相对宽松的矩阵乘法部分,而将需要高精度的非线性运算和逻辑控制留给电子处理器去处理。从这个意义上说,光计算延续了模拟派一以贯之的核心理念:用受控的噪声,换取极致的能效与速度。

六、大模型时代的新方程:混合计算范式的兴起

让我们回到费曼与冯·诺依曼那场未竟的辩论。他们争论的核心,其实是一个在今天的大模型时代重新变得无比紧迫的问题:对于计算任务而言,到底需要多高的精度才“够用”?

答案开始变得清晰:对于不同性质的计算任务,“够用”的标准天差地别。 大语言模型推理的解码阶段对延迟极其敏感但对精度相对宽容;模型训练阶段则对一批次迭代的累积误差有一定容忍度;而金融结算、科学计算则对每一比特的误差都零容忍。

这就催生了一个全新的计算范式——数模混合计算。其核心逻辑是:光负责大规模并行矩阵乘法,电负责非线性激活函数和高精度逻辑控制。 以曦智科技的旗舰产品PACE2(曦智天枢)为例,它是一块标准尺寸的PCIe加速卡,插在现有的服务器上以“协处理器”模式工作:CPU/GPU负责通用计算和非线性运算,而PACE2则利用其光学处理单元(OPU)来专门加速神经网络中最耗能的线性矩阵乘法部分,完成计算后通过高速接口将结果返回电子域。

这不是一场非此即彼的“路线之争”,而是一场基于物理规律的“分工优化”。 现代AI计算的理想形态,既不是纯粹的数字系统,也不是100%的模拟系统,而是一个**“分层异构”的混合体系**:

模拟层(光子/忆阻器): 执行高密度、低精度的矩阵乘法,负责吞吐量。
数字层(CMOS处理器): 执行复杂的逻辑控制和高精度运算,负责正确性与灵活性。

用费曼的话来理解:当你的任务需要以极高的吞吐量去逼近一个模糊的答案时,用模拟手段直接“物理求解”是远远快于你先把它翻译成0/1语言,再跑一遍通用算法的——因为物理过程本身就是计算,不需要在符号世界与物理世界之间来回翻译。费曼早在1948年就预见到这一逻辑:“在给定场合下,计算系统究竟是选用模拟机制还是数字机制,必须基于任务的特性来做出合理决策。”这个观点,在AI大模型时代遇到了它最完美的实践场景。

结语:从“取代”到“共生”

回顾这场持续半个多世纪的哲学辩论,一个清晰的脉络浮现出来:数字路线凭借“噪声免疫”能力赢得了20世纪,模拟路线则凭借“能效极限”能力在21世纪的AI时代卷土重来。

这当然不是说我们要放弃数字计算,回到模拟机的史前时代。未来的计算范式,是数字的“精度”与模拟的“效率”在系统层面的深度融合——

数字负责“对”的部分,模拟负责“快”的部分。

正如中国信通院的报告所指出的,信息光子技术与微电子技术正在走向“光电融合”这一更高维度的整合。“光擅长线性+并行,电擅长非线性+控制”——在这种新的分工框架下,光与电不再是非此即彼的单选题,而是可以被工程设计重新分配的两类资源。这也是曦智科技招股书里反复出现的“光电混合计算”和“光算连一体”等概念的核心内涵。

而这,恰恰是我们这个系列接下来的旅程——光计算究竟是如何用光子来执行矩阵乘法的?它到底能快多少? 且听下回分解。

下一篇: 《“光脑”怎么算数学题?——光计算原理入门》

参考文献

  1. Feynman, R. P. (1996). Feynman Lectures on Computation. Addison-Wesley. (包含1948年论文“Analog versus Digital”及1983-1986年Caltech讲座内容)
  2. Neumann, J. v. (1948). The General and Logical Theory of Automata. Lecture at Caltech, September 1948.
  3. Mead, C. (1990). Neuromorphic electronic systems. Proceedings of the IEEE, 78(10), 1629-1636.
  4. Gholami, A., Yao, Z., Kim, S., et al. (2024). AI and Memory Wall. IEEE Micro, 44(3), 33-39.
  5. Shen, Y., et al. (2017). Deep learning with coherent nanophotonic circuits. Nature Photonics, 11, 441-446.
  6. Xu, X., et al. (2021). 11 TOPS photonic convolutional accelerator for optical neural networks. Nature, 589, 44-51.
  7. Tsividis, Y. (2018). Not your father‘s analog computer. IEEE Spectrum, 55(3), 38-43.
  8. 中国信息通信研究院. (2025). 《信息光子技术发展与应用研究报告(2025年)》.
  9. 上海曦智科技股份有限公司. (2026). 《全球發售招股章程》,股份代号:01879.
  10. 北京大学孙仲团队. (2025). 新型电阻式存算一体芯片实现24-bit精度突破. Nature Electronics.
  11. Taiwania Capital. (2025). 台积电Nature论文:异质INT-FP混合CIM架构.
  12. MIT FutureTech. (2026). How Much Progress Has There Been in NVIDIA Datacenter GPUs? arXiv:2601.20115v2.
  13. 李国杰. (2019). 智能计算机的历史、现在和未来. 中国科学院院刊.
  14. International Energy Agency. (2025). World Energy Outlook 2025.
  15. Analog Devices. (2012). Understanding Noise, ENOB, and Effective Resolution in Analog-to-Digital Converters. ADI Technical Documentation.
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐