一、什么是智能网卡?为什么现在必须关注?

网卡(NIC)是设备接入网络的"桥梁",也是网络通信的"端点"。传统网卡的职责很简单:把数据从主机送出去、把数据从网络收进来。但随着云计算、人工智能、大规模智算中心的爆发式增长,传统网卡早已力不从心。

以 100G 网络为例,线速发送 64 字节小包时,每秒要处理 148,809,523 个报文。这个量级的数据处理全靠 CPU,几乎不可能实现。而 智能网卡(SmartNIC) 的出现,正是为了把这部分压力从 CPU 卸载到专用硬件上,让 CPU 专注于业务逻辑,网卡负责协议处理、安全加密、流量调度。

根据 Market Research Future(MRFR)报告:

  • 2023 年全球智能网卡市场约 46 亿美元,预计 2030 年达 98 亿美元,CAGR 11.5%
  • 2023 年全球 RDMA 网卡市场约 27 亿美元,预计 2028 年达 62 亿美元,CAGR 17.6%

国内对应市场分别约为 15 亿美元和 6.5 亿美元,但目前基本被 NVIDIA(Mellanox)、Intel、Broadcom、Marvell 等国外厂商垄断。这也正是国产智能网卡的战略机遇所在。

二、三类智能网卡横向对比:FPGA vs ASIC vs DPU

市场上的智能网卡按硬件架构分为三大类,各有优劣:

类型

代表产品

优势

劣势

**基于 FPGA 的智能网卡**

Xilinx Alveo、鸣镝网卡

可编程性强,灵活定制,适合多场景

单价较贵,开发门槛较高

**基于 ASIC 的智能网卡**

Mellanox ConnectX 系列

性能极高,功耗低

灵活性差,不适合小批量,迭代慢

**基于 DPU 的智能网卡**

NVIDIA BlueField

兼具高性能与可编程性

生态尚不成熟,单价更贵

FPGA 智能网卡的核心优势:在协议快速演进、业务场景多样化的今天,FPGA 的可重编程能力使其成为研究机构、测试领域、定制化场景的首选。通过更新 Firmware,即可升级硬件逻辑,无需换卡。

三、北京网测科技鸣镝 FPGA 智能网卡深度介绍

3.1 研发背景

北京网测科技有限公司(netitest.com)扎根通信领域多年,为了实现 2-7 层全栈网络测试,依靠 FPGA 芯片和定制化板卡,自主研发了 鸣镝智能网卡(也写作"鸣镝网卡")。

研发目标:

  • 2-3 层测试:FPGA 硬件实现多流线速收发,时延和抖动精度 10纳秒以内
  • 4-7 层测试:依靠 DPDK 和用户态协议栈,实现无锁、零拷贝的高速 TCP/HTTP/HTTPS 应用测试
  • 全面支持 RoCEv2 / RDMA / UEC 协议,面向智算网络场景

3.2 三款核心产品型号

�� MD4X025GF27LB — 1G/10G/25G 接入测试利器
  • 网口:4 × 1/10/25G SFP28
  • PCIe:3.0 × 8
  • 收发器:16 × GTY 32.75G NRZ
  • 时钟同步:2 × IPEX(板卡间)+ 1 × SMA(1588v2 外部时钟)
  • 适用场景:中低速率网络测试,ToR 接入层设备验证
�� MD2X100GF27LA — 100G 骨干网验证之选
  • 网口:2 × 100/50/40G QSFP28,支持 1分4(8 × 10/25G 模式)
  • PCIe:3.0 × 16
  • 收发器:32 × GTY 32.75G NRZ
  • 时钟同步:2 × IPEX(板卡间)+ 1 × SMA(1588v2 外部时钟)
  • 适用场景:100G 数据中心、智算集群网络测试
�� MD1X400GF27LA — 400G 超高速数据中心旗舰
  • 网口:1 × 400G QSFP112,支持 1分4(4 × 100G 模式)
  • PCIe:5.0 × 16(最新标准,带宽翻倍)
  • 收发器:4 × 116G PAM4
  • 时钟同步:2 × IPEX(板卡间)+ 1 × SMA(1588v2 外部时钟)
  • 适用场景:400G 超高速数据中心、AI 训练集群、无损网络压测

3.3 核心技术指标一览

指标

参数值

时延 / 抖动精度

**4 纳秒**

时间戳精度

10 纳秒以内

速率覆盖

1G → 400G(路线图覆盖至 800G)

100G 线速小包(64字节)转发率

**148,809,523 包/秒**

RSS 多接收队列

✅ 支持

卡间时钟同步

✅ 支持(IPEX 接口)

1588v2 外部时钟同步

✅ 支持(SMA 接口)

Firmware 在线更新

✅ 支持,可升级硬件逻辑

四、软件生态:五层驱动架构,覆盖全场景

鸣镝智能网卡拥有完整的软件驱动生态,支持内核、DPDK、RDMA 多种使用方式:

┌─────────────────────────────────────┐
│   Tester(测试控制逻辑 / 应用层)      │
├──────────────┬──────────────────────┤
│ libntsnic.so │    libdpdk.so        │
│(用户态控制库)│(DPDK 用户态 IO 库)  │
├──────────────┴──────────────────────┤
│ ntsnic.ko(字符型驱动,ioctl 控制)    │
│ onic.ko(内核开源驱动,协议栈收发)    │
├─────────────────────────────────────┤
│          鸣镝 FPGA 网卡硬件            │
└─────────────────────────────────────┘

组件

用途

`onic.ko`

Linux 内核开源驱动,通过内核协议栈收发报文(典型场景:IPSec 测试)

`ntsnic.ko`

字符型驱动,通过 ioctl 进行 FPGA 控制、流控制、统计获取

`libntsnic.so`

用户态调用库,封装 ioctl 接口

`libdpdk.so`

DPDK 用户态 IO 驱动,零拷贝高性能收发

`Tester`

测试控制框架,调用上述库完成各类测试用例

协议支持:RDMA / RoCEv2 / UEC / PFC / ECN / DCQCN,支持 280+ 种协议

五、FPGA 系统架构:精准到纳秒的流控与统计

5.1 基于流的设计理念

鸣镝智能网卡的收发以""为基本单位,支持三类流:

  • FPGA L2-3 层流:纯硬件处理,不经过 PCIe 和 CPU,延迟极低
  • PCIe L4-7 层流:经 PCIe 与 CPU 通信,走内核路径
  • DPDK 流:经 PCIe/QDMA,走 DMA 和 UIO 路径

初期支持 1024 条并发流每条流独立维护统计,互不干扰。

5.2 精准的时延统计:纳秒级硬件时间戳

每个报文尾部携带 16 字节流标记字段

  • 4字节报文 ID:用于实时丢包、乱序统计
  • 8字节纳秒级时间戳:由 FPGA 内部 100MHz 晶振生成,与 OS 时钟同步
  • checksum 配平字段:保证 UDP/TCP 校验和不变

时延计算公式:`单报文时延 = 接收时间戳 - 发送时间戳(纳秒)`

以 100MHz 时钟的 64 位计数器为例,理论上可持续记录约 5849 年才会溢出。

5.3 吞吐率统计

按以太网 V2 帧结构(含 20 字节帧头帧尾)精确计算:

吞吐率(bps) = 报文数 × (帧长 + 20字节帧间开销) × 8

示例:100 万报文 × 1518 字节帧长 × 8 = 12.14 Gbps

六、智算网络测试:RoCEv2 / RDMA 全栈支持

6.1 为什么智算中心需要专业测试仪?

在智算中心网络中,万分之一的丢包率就会导致吞吐量下降 90%。RDMA 技术本质上是把会话保持、拥塞控制等协议栈功能硬件化,极度依赖无损网络环境。

智算网络的关键技术栈:

  • RoCEv2:基于 UDP/IP 封装 RDMA 数据,UDP 端口 4791,支持跨路由器传输
  • PFC(Priority Flow Control):8 优先级独立流控,防止丢包
  • ECN + DCQCN:显式拥塞通知 + 数据中心量化拥塞通知,动态调速

6.2 鸣镝网卡 RoCEv2 测试套件能力

基于鸣镝 FPGA 智能网卡,网测科技提供完整的 RoCEv2 智算网络测试套件

✅ 协议完整性

  • 支持完整 RoCEv2 协议栈:QP 会话保持、可靠传输、拥塞控制
  • 与标准开源工具 perftest 互连互通(单臂模式)
  • 每端口支持 8192 个 QP 并发

✅ 传输模式

  • RC(Reliable Connection)可靠连接模式:Send / Read / Write 三种操作
  • UD(Unreliable Datagram)模式
  • 支持报文重传、接收确认、乱序重组、信用管理

✅ 拥塞控制测试

  • PFC 发送暂停
  • ECN 配置(NP/RP/CP 三节点角色仿真)
  • DCQCN 全参数可配(Alpha、更新周期、初始值等)

✅ 安全与压力测试

  • RoCEv2 模糊测试(Fuzz Testing):对 BTH/Opcode/Payload 等字段进行协议健壮性验证
  • DDoS 泛洪测试:CM 新建攻击、NAK/CNP 报文攻击
  • 流量攻击:PSN 乱序攻击、ICRC 错误攻击

七、应用场景:鸣镝智能网卡能解决什么问题?

�� 场景一:数据中心网络性能验证

在交换机上线前,用鸣镝网卡打 100G/400G 线速流量,验证设备的吞吐、时延、丢包是否达标,发现转发芯片缺陷或配置错误。

�� 场景二:智算集群无损网络压测

模拟 GPU 训练集群的 All-Reduce / All-Gather 等集合通信流量(NCCL 仿真),验证交换机 PFC、ECN、ECMP 负载均衡的正确性,确保 AI 训练不因网络问题降速。

�� 场景三:安全设备测评

模拟多种协议流量和 DDoS 攻击,验证防火墙、IPS 等安全设备在高压下的处理能力,支持 280+ 种协议。

��️ 场景四:云计算虚拟化卸载验证

通过 DPDK 用户态 IO 和 RoCEv2 协议栈,验证 vSwitch、SR-IOV、虚拟化环境下的网络性能和卸载效果。

���� 场景五:信创网络设备国产化测试

配合 DarkBird 信创硬件仪表,基于国产 FPGA 芯片,提供完全国产化的测试解决方案,满足信创采购要求。

八、完整测试仪产品线:Supernova / DarkBird

鸣镝 FPGA 智能网卡是网测科技测试仪表体系的核心硬件,搭配不同机框,形成完整产品线:

产品型号

规格

适用场景

**Supernova-200F**

2U,2个插槽,支持 1G-100G

中小规模测试,边界测试

**Supernova-600F**

3U,6个插槽,支持 1G-100G

中大规模,集群模式

**Supernova-3200F** / **DarkBird-80G**

8U8N,8节点,32×100G QSFP28

大规模数据中心,高密度端口

**DarkBird-400G**

信创硬件,支持 400G

信创网络、国产化测试

所有机框支持热插拔刀片扩展,可根据测试需求灵活搭配不同速率的 FPGA 网卡模块。

、关于北京网测科技有限公司

北京网测科技有限公司,官网 [www.netitest.com](http://www.netitest.com),致力于全栈信息通信测试领域。

核心能力:

  • 自研 FPGA 智能网卡(鸣镝系列,速率 1G-400G)
  • 完整 Linux / DPDK / RDMA 驱动生态
  • 全栈 2-7 层测试仪表(Supernova / DarkBird 系列)
  • RoCEv2 / RDMA / UEC 智算网络测试套件
  • 280+ 协议支持,含安全攻防测试

秉承"仪表·测评·服务"的理念,为数据中心、智算中心、通信运营商、网络安全厂商提供专业的测试解决方案。

总结

智能网卡已经成为数据中心和智算中心的核心基础设施。FPGA 智能网卡凭借其灵活可编程、高精度、全速率覆盖的优势,在测试、验证、定制化场景中不可替代。

北京网测科技鸣镝 FPGA 智能网卡,以 4纳秒时延精度、1G-400G 全速率覆盖、完整 RoCEv2 协议栈、280+ 协议支持,为国内智算网络建设提供专业的测试与验证能力,是真正的国产 FPGA 智能网卡实践者。

#智能网卡 #FPGA智能网卡 #鸣镝网卡 #鸣镝网卡 #RDMA #RoCEv2 #智算网络 #北京网测科技 #DPU #信创网卡 #网络测试仪 #无损网络

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐