在泛安防集成与工业视觉智能化项目落地落地中,绝大多数技术团队都会踩进同一个“深坑”——流媒体协议的黑洞与硬件生态的割裂

现场环境错综复杂,海康、大华、宇视等各家老旧设备各行其是。当你试图像拼积木一样把 GB28181、RTSP、ONVIF 协议组合起来,同时还要兼顾 H.264/H.265 的动态解码,再分发到 X86 GPU 服务器或 ARM 架构的边缘计算盒子进行 AI 推理时,你会发现:底层的信令握手、高并发下的流媒体解包、异构芯片的驱动适配,任何一个细节都能拖垮一个 10 人的研发团队

为了解决这一行业痛点,本文将从架构师视角深度拆解一款工业级 AI 视频管理平台。它通过容器化微服务底座南向协议解耦层,打通了芯片、算法到应用的全流程组合,直接为企业级应用落地节省了约 95% 的开发成本

一、 统一流媒体中台:GB28181 与 RTSP 的高并发解耦设计

在传统架构中,针对国标协议(GB28181)和局域网协议(RTSP/ONVIF)通常需要维持两套完全独立的流媒体网关,信令与媒体流交织在一起,极难维护。本平台的核心设计在于全面解耦信令层与媒体传输层,构建了一个统一的流媒体抽象网关。

+-------------------------------------------------------------------------+
|                          统一流媒体中台 (抽象层)                         |
+-------------------------------------------------------------------------+
|     GB28181 接入层       |      RTSP/RTMP 边缘推流      |  ONVIF 控制层  |
|  (SIP信令/主动注册/级联)  |    (低延迟拉流/流媒体转发)    |  (云台PTZ控制) |
+------------------------+---------------------------+--------------------+
|                                    |                                    |
|              ▼                     ▼                     ▼              |
+-------------------------------------------------------------------------+
|                        统一媒体流分发总线 (H.264 / H.265)                |
+-------------------------------------------------------------------------+

1. 核心流媒体协议栈技术参数

系统对多源异构设备进行了全方位的泛化接入支持,核心技术指标如下:

  • 多协议无缝兼容

    • GB28181 模式:支持广域网利旧与新设设备的国标主动注册,支持完整的 SIP 信令交互、目录检索、跨网段国标级联。

    • RTSP/RTMP 模式:提供高并发的边缘推流与拉流能力,支持实时音视频的低延迟提取。

    • ONVIF 模式:内置标准 ONVIF 协议栈,实现对摄像机云台(PTZ)的精准交互与现场控制。

  • 全格式编解码自适应

    • 完美支持 H.265 / H.264 视频格式的高效解包、无损抽帧与二次分发,无缝对接下游 AI 推理引擎。

  • 灵活组网拓扑

    • 支持中心化集群部署与“中心-边缘”多级星型组网,适应从单一园区到跨省域大系统的多维复杂度需求。

2. 多协议统一接入网关配置模拟

对于开发人员而言,无需再为复杂的国标注册流或 RTSP 握手编写繁琐的代码。平台将其高度抽象,用户仅需通过一个简单的网关配置文件,即可实现不同品牌、不同协议设备的无缝并网与 AI 推理联动:

YAML

# media_gateway_pipeline.yaml
# 统一视频流路由与边缘AI布控配置文件示例

gateway_config:
  server_id: "edge_node_south_01"
  max_concurrent_streams: 128

stream_routing_table:
  # 示例 1:通过 GB28181 国标协议接入的海康球机
  - channel_id: "cam_field_001"
    device_name: "一号主干道国标球机"
    protocol_type: "GB28181"
    sip_profile:
      device_code: "34020000001320000001"
      domain: "3402000000"
      local_port: 5060
    codec_preference: "H265"
    ai_pipeline:
      enabled: true
      algorithm_id: "algo_pedestrian_count" # 挂载人流量统计算法

  # 示例 2:通过 RTSP 协议直接拉取的大华枪机
  - channel_id: "cam_field_002"
    device_name: "西侧围墙边缘枪机"
    protocol_type: "RTSP"
    rtsp_profile:
      source_url: "rtsp://admin:dahua123@192.168.1.120:554/cam/realmonitor?channel=1&subtype=0"
      transport: "TCP" # 强制使用 TCP 减少丢卡顿
    codec_preference: "H264"
    ai_pipeline:
      enabled: false

二、 异构计算与跨平台部署:打通软硬件“孤岛”

安防智能化项目最大的痛点之一就是硬件供应链的频繁变动。今天用 NVIDIA GPU 服务器,明天可能因为成本或国产化要求切到瑞芯微(Rockchip)或算能(Sophgo)的 ARM 边缘盒子。

本平台基于 Docker 容器化 技术,实现了应用层与底层硬件架构的彻底解耦:

  • 跨指令集支持:提供面向 x86_64ARM64 的多阶段构建镜像,无论是在中心机房的 X86 重载服务器,还是在路侧、厂区的 ARM 边缘盒子,均可实现一键容器化拉取与部署。

  • 异构算力调度:南向驱动层完美适配多种 GPU 服务器与 NPU 边缘计算硬件,支持客户根据项目实际需求定制化 GPU 品牌。通过轻量化边缘平台,技术人员可在中心端远程控制边缘盒子实际运行的算法类型、调整识别告警间隔、进行算法程序版本管理以及远程日志诊断。

三、 白盒源码交付:为集成商构筑二次开发生态

市场上的“黑盒”AI 平台往往按路数、按算法年限收取高昂的授权费,导致集成商在面对甲方定制需求时极度被动。

本平台提供私有化部署与白盒源代码交付模式,自研纯净源码,不依赖任何第三方闭环组件。

1. 完善的 AI 工业闭环功能集群

平台不仅仅是一个流媒体播放器,而是将安防全生命周期的功能进行了高密度集成:

  • 算法商城:内置丰富的现成算法模型,支持手动新增算法、对已有算法挂载新的模型文件,并支持同一算法版本的平滑升级与降级。

  • 标注平台:提供完全自主的私有化数据标注环境,用户可自行标注,沉淀企业专属算法资产。

  • 告警生命周期管理:汇总所有 AI 推理后的告警数据,支持原图导出、多维筛选。内置自动缩容机制,默认每天 24:00 自动执行高并发异步清理线程,清除超过保存时长的历史图片,平衡磁盘开销与数据可追溯性。

2. 丰富的北向 API 与事件订阅(二次开发示例)

平台提供了极其丰富的微服务 API,支持语音电话、飞书、企业微信、钉钉、APP 及第三方接口等全方位告警通知。以下为集成商进行二次开发时,订阅实时 AI 告警流并联动现场音柱设备的伪代码示例:

Python

# alarm_subscriber_demo.py
import requests
from yihe_client import EventStreamListener

# 初始化平台客户端
API_ENDPOINT = "http://192.168.1.10:8080/api/v1"
AUTH_TOKEN = "jwt_token_string_here"

def on_ai_alarm_received(event_payload):
    """
    实时AI告警事件回调函数
    """
    algorithm_type = event_payload.get("algorithm_type")
    camera_name = event_payload.get("camera_name")
    
    print(f"[告警触发] 监控点: {camera_name} | 触发算法: {algorithm_type}")
    
    # 场景联动:如果检测到有人闯入,立刻通过第三方接口驱离现场音柱
    if algorithm_type == "intrusion_detection":
        trigger_url = f"{API_ENDPOINT}/audio/column/broadcast"
        headers = {"Authorization": f"Bearer {AUTH_TOKEN}"}
        data = {
            "device_id": "sound_column_west_01",
            "broadcast_text": "警告,您已进入监控区域,请立即离开!",
            "volume": 80
        }
        response = requests.post(trigger_url, json=data, headers=headers)
        if response.status_code == 200:
            print("-> 现场音柱联动语音喊话成功")

# 启动高并发事件流监听(底层基于 WebSocket / SSE 解耦)
listener = EventStreamListener(endpoint=API_ENDPOINT, token=AUTH_TOKEN)
listener.subscribe(topic="video_ai_alarms", callback=on_ai_alarm_received)
listener.start_forever()

3. 高收益的贴牌合作(OEM)

系统自带一键 LOGO 替换与全局改名功能。集成商在拿到源码后,可以在几分钟内抹除底层痕迹,将其完全包装为公司的自研核心产品交付给政府、电力、园区等行业甲方,极大提升了企业的技术护城河与商务溢价能力。

四、 核心场景算法:高精度人流量统计状态机

作为平台内置算法的典型代表,人流量统计模块完美展示了“视频+AI”的高效结合。它可广泛应用于商场、博物馆、车站等高密场景,提供精准的数据支撑:

  • 进入/离开人数:通过在 AI 监控大屏或系统界面上进行简单的鼠标拖拽、绘制统计线与感兴趣区域(ROI),算法便能精准识别人员的移动轨迹并进行双向计数。

  • 区域剩余人数:系统动态计算同一台监控摄像机下进入人数与离开人数的差值(根据场景基数初始化,可为负数进行动态校准),实时监控区域饱和度。

  • 全全局可视化趋势:系统会自动汇总当前平台下全部计算单元、所有摄像机的人流量数据,生成以时间、日期为维度的总人流量变化趋势图表,实现 clarity at a glance。

五、 架构师总结与演示环境邀测

这套企业级 AI 视频管理平台通过 Docker 容器化、异构算力抽象、以及高度统一的流媒体中台,真正终结了安防行业协议碎片化、芯片各异带来的研发泥潭。对于追求深度自主可控、希望摆脱传统黑盒软件按路数收费的系统集成商而言,“源码交付”配合“节省 95% 开发成本”的特性,无疑是打赢降本增效攻坚战的底牌。

目前该系统的核心框架已在 Git 平台开源,欢迎各位技术决策者与同行架构师前往体验。

🌐 演示环境与开源信息

  • 官方开源地址Gitee - 义和视频AI管理平台

  • 在线演示环境http://demo.yihecode.com:8080 (示例地址)

  • 系统超级管理员admin

  • 默认访问密码admin123

技术交流引导:如果您对系统的底层流媒体高并发分发性能、国产化 NPU(如 RK3588、算能系列)的底层硬解码适配细节,或是白盒源码交付的商业授权边界感兴趣,欢迎在评论区留言切磋,或直接前往 Gitee 提交 Issue。我们共同探讨下一代边缘计算视频中台的技术演进!

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐