边缘计算、AI人工智能应用场景不断普及,高算力主控芯片的选型愈发受到行业关注。作为瑞芯微两大热门AIOT芯片,旗舰级RK3588与次旗舰RK3576一直是工业智能、视觉识别、边缘计算、AI终端开发的热门选择。不少开发者在方案选型时,常常困惑于两款芯片在AI算力、NPU推理性能、资源占用以及实际场景表现上的真实差距。触觉智能作为瑞芯微方案商,以此2款AI算力核心能力展开对比,以官方RKNN大模型、本地部署Deepseek为标准进行测试。

测试环境说明

  • RKNN测试

本次测试均基于相同的瑞芯微原厂rknn_yolov5_demo环境,采用统一的 yolov5s-640-640 模型和 640*640 分辨率测试图片。使用的RKNN框架,框架提供完整的 "模型转换-部署-推理" 解决方案。可帮助用户快速地将AI模型部署到Rockchip芯片,整体框架图:

图片

测试demo可关注触觉智能CSDN获取。

  • DeepSeek 性能对比

测评大家可直接点击视频观看:

https://www.bilibili.com/video/BV1BUXkYREYj/?spm_id_from=333.1387

性能测试

  • 下载Demo

测试前,需先下载rknn_yolov5_demo测试demo,可关注触觉智能公众号,添加客服134-2385-6106获取。下载后传输至开发板根目录即可。

  • RK3576 NPU性能测试

解压demo均可使用此命令:

unzip  rknn_yolov5_demo_Linux.zip

完成解压后输入以下命令:

root@linaro-alip:/# cd install/rknn_yolov5_demo_Linux
root@linaro-alip:/# chmod a+x rknn_yolov5_demo
root@linaro-alip:/mnt/rknn-toolkit2-master/rknpu2/examples/rknn_yolov5_demo/install/rknn_yolov5_demo_Linux# ./rknn_yolov5_demo ./model/RK3576/yolov5s-640-640.rknn ./model/bus.jpg 

执行完后会得到转换后的模型图片,如图所示:

图片

RK3576运行结果如下:

图片

分析结果:

首次运行耗时约:55.395000ms

连续运行10次的平均耗时:23.7342ms

帧率估算:约42.1FPS (1000ms/23.7342ms≈42.1)

  • RK3588 NPU性能测试

解压demo均可使用此命令:

unzip  rknn_yolov5_demo_Linux.zip

完成解压后输入以下命令:

root@linaro-alip:/rknpu2/examples/rknn_yolov5_demo# cd install/rknn_yolov5_demo_Linux/
root@linaro-alip:/rknpu2/examples/rknn_yolov5_demo/install/rknn_yolov5_demo_Linux# chmod a+x rknn_yolov5_demo
root@linaro-alip:/rknpu2/examples/rknn_yolov5_demo/install/rknn_yolov5_demo_Linux# ./rknn_yolov5_demo ./model/RK3588/yolov5s-640-640.rknn ./model/bus.jpg

执行完后会得到转换后的模型图片,与RK3576图片一致就不再放了。

RK3588运行结果如下:

图片

分析结果:

首次运行耗时约:30.887000ms

连续运行10次的平均耗时:21.2581ms

帧率估算:约47.0FPS (1000ms/21.2581ms≈47.0)

更多瑞芯微方案相关资料,请关注深圳触觉智能~

测试结果对比

  • 测试数据汇总表

如图所示:

图片

  • 对比结果总结分析

测试均基于相同的rknn_yolov5_demo环境,采用统一的yolov5s-640-640模型和640*640分辨率测试图片,测试条件一致,结果具有较强的参考性。

  • 帧率表现(实时性)

RK3588 以 47.0 FPS 的帧率位居领先,实时处理性能更为强悍;次旗舰 RK3576 帧率可达 42.1FPS。两款芯片帧率均突破40FPS,RK3588与RK3576完全能够满足高清视频流目标检测等高实时性边缘AI场景的运行需求。

  • 运行耗时(效率)

平均耗时与帧率呈反向关联,旗舰 RK3588以 21.2581ms 的平均耗时实现整体效率最优。次旗舰 RK3576 首次运行耗时相对偏高,达到 55.395ms,该现象主要源于模型初次加载与缓存初始化带来的额外开销;进入连续稳定运行阶段后,平均耗时降至 23.7342ms,性能表现已十分接近 RK3588。结合芯片成本定位来看,RK3576综合性价比优势十分突出。

  • 场景适配建议

旗舰级 RK3588 与次旗舰 RK3576 均适配对目标检测实时性要求严苛的高端边缘场景,例如高清智能监控、视觉感知、车载辅助视觉等应用。二者性能梯度分明,可根据项目算力需求、预算成本灵活选型。

旗舰RK3588虽说实时帧率、处理效率上全面领先;次旗舰RK3576展现出首次加载略有差距、连续运行性能高度逼近旗舰的特点,在绝大多数常规 AI 推理场景中都能提供出色体验,总的来说RK3576是兼顾性能与成本的高优选型方案。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐