新型电力系统应该用什么数据库?源网荷储四侧的时序数据库选型与落地实战

“双碳”目标的推进正在深刻重构电力系统的运行逻辑。新能源装机占比持续攀升,储能、虚拟电厂、需求响应等新业态快速涌现,源、网、荷、储各侧的角色与互动方式正在被重新定义。电力系统正在从“计划驱动、慢速响应”的传统模式,转向“市场驱动、实时反馈”的新模式。

这种转变,对数字化平台提出了全新的要求。过去,电力数字化系统更多扮演“记录者”的角色——把数据存下来,事后算清楚。但现在,调度需要准实时的感知,负荷侧需要在事件过程中边执行边评估,交易需要快速适配变化的规则……数据不仅要采上来,还要算得快、算得准、能闭环。

这就引出了一个值得探讨的问题:什么样的数据底座,才能支撑起新型电力系统的实时化需求?

一、新型电力系统到底哪里变了?

要回答前面的问题,我们得先看看业务本身在发生哪些变化。

电力系统有两个核心任务:一是电力平衡,二是合理定价。围绕这两个任务,形成了两个循环:

  • 物理运行闭环:发电侧出力变化 → 电网状态变化 → 调度校核 → 发送指令 → 源侧/荷侧响应

  • 市场价格闭环:供需变化 → 价格变化 → 源侧报价 / 荷侧用电行为调整 → 实际出力 / 负荷变化→形成新的供需结构

过去,这两个循环运行得比较慢。以物理运行闭环为例,传统电力系统以火电为主,出力变化可预期,调度校核以日前和日内为主,指令频率低、对象集中。但新能源大量接入之后,风电光伏的出力波动大、不确定性高,火电从主力变成了调峰角色;新能源的集中接入还导致局部过载和反向潮流,跨区输电越来越频繁,在线监测的密度也大幅提升;调度从“昨天定计划”变成了“随时做调整”,调度对象也从几个大电厂变成了无数个储能、可调负荷、新能源场站。

同时,价格闭环的运行也在加速。以前市场参与主体少,价格信号更多是事后反映,大家的调整行为比较慢。现在发电侧的报价策略越来越精细,会根据价格决定发多少电;用电侧也开始参与进来,比如电动车充电会选电价低的时候,甚至有些用能服务可以直接响应市场价格信号。

所以,我们可以很直观地发现:电力系统正在从可预期的、慢节奏的系统变成不确定性强、需要实时响应的系统。这个变化直接传导到了数据治理平台上——它不能再只做事后记录,而是需要实时感知、实时计算、实时决策。

二、电力新业态带来的数字化挑战

这种趋势给支持电力系统运行的数据平台带来了三大挑战。

首先是采集数据的挑战。

电力行业的数据天然是量大、源多、质量参差不齐的。发电侧有 SCADA、AGC、气象预报、机组状态等多源数据,缺测、时钟漂移、补传乱序的问题很常见;电网侧有 PMU、录波、在线监测产生的高频海量数据,加上 SCADA 和台账,告警风暴、丢包重复、时间基准不统一,让事件定位变得很困难;用电侧有海量的计量点,漏采、飞码、倒走等问题常态化;调度和交易中心也面临数据源多且分散、但对质量和一致性要求却极高的问题。这些问题如果不及时处理,就会在后续分析中被不断放大。

其次是关于实时性的挑战。

从计划驱动到准实时闭环,每个环节的耗时都在压缩。发电侧需要分钟级滚动计算,因为出力波动快,策略调整必须跟上;电网侧需要秒级态势感知,越限、反向潮流要秒级发现;用电侧在需求响应时,需要分钟级聚合负荷、实时跟踪响应效果;调度周期大幅缩短,要求更高频的监测、校核和指令生成;交易中心则面临申报、查询、报表集中在窗口期的压力,系统需要有足够的高吞吐能力。

最后是关于计算复杂度的挑战。

发电侧虽然计算指标相对简单(滚动聚合、偏差统计),但测点特别多、采样频率高,数据量极大;电网侧要处理大量监测指标,需要持续计算与实时更新;用电侧的情况更复杂,同一批数据要按分时、分用户、分区域、分行业等多个口径计算,指标体系扩张很快,批计算压力大;调度中心需要做 SCUC、SCED 这种大规模优化求解,约束条件复杂;交易中心既要处理海量交易明细,又要派生多维指标体系,结算规则还经常变化,需要快速适配和可追溯复算。

三、新需求下传统架构已显疲态

在电力系统变化慢、主体少、规则稳定的年代,行业普遍采用的是一种多组件拼装的技术路线。

这种架构的典型特征是:

  • 数据按类型拆开放:关系库存台账、时序库存曲线、数仓存汇总结果;

  • 计算按场景拆开做:批处理用 Spark、流计算用 Flink、复杂业务逻辑写 Java、优化问题交给求解器;

  • 业务按系统拆开建。

在早期,这套方案能跑通。但现在,它的局限越来越明显:

  • 数据存储割裂:数据散落在关系库、时序库、数仓、流平台等多个系统里,想做一个跨系统的关联分析,就得靠 ETL 和接口同步。数据虽然都采上来了,但很难形成统一视图。

  • 实时计算与离线分析的割裂:传统架构中,Flink 做实时计算,Spark 做批处理,应用层再单独查数据库。而真正的业务场景,比如发电侧的偏差分析,需要实时功率、历史预测和气象数据一起参与计算;需求响应核验需要实时负荷、基线模型和用户档案一起参与计算。在传统架构下,这类计算往往需要跨多个系统,实时性和一致性都很难保证。

  • 计算引擎分散,maintenance fee高:一个业务场景要横跨多个引擎,不同引擎的开发语言、运行环境、运维方式都不一样。一个指标在流平台上算一版,在数仓里汇总一版,在 Java 服务里再加工一版,最后很可能出现同一个指标在不同地方结果不一致的情况。

  • 规则变化时maintenance fee高:新型电力系统的规则、边界、策略变化频繁。传统方案中很多规则是写在 Spark 作业、Flink 算子、Java 代码或 SQL 存储过程中的。每次规则变化都要改代码、重测、重部署、重对账,结果导致系统响应越来越慢。

所以,传统架构的问题不是没有专业组件,而是组件太多、链路太长、数据与计算彼此割裂。有没有一种架构能把数据接入、存储、计算、分析收敛到同一个平台里,让数据处理不再割裂,让实时计算和历史分析能够协同,让规则变化时只需要改配置而不是改代码?

四、数据底座选型新思路

在目前的一些电力项目中,我们可以观察到一个明显的变化:系统架构不再一味地往外拆,而是开始向内敛——尝试把原本分散在多个系统中的能力,重新整合到一个统一的平台中。

这类系统通常具备以下几个主要特征:

  • 能处理高频时序数据,也能处理结构化数据;

  • 同时支持实时计算与历史分析;

  • 计算尽可能在数据产生的地方完成;

  • 规则可以通过配置或脚本灵活表达。

在具体实现上,DolphinDB 就是一个典型的例子。它是一个基于高性能时序数据库、支持复杂分析与流处理的实时计算平台,帮助企业在一个平台上解决数据接入、存储、实时计算、历史分析等问题。

其核心价值在于:

  • 存算一体:数据存储和计算在一个平台内完成,避免跨系统搬运,大幅降低时延;

  • 敏捷的开发体验:将复杂的业务逻辑抽象为可复用的脚本和函数,通过参数化配置快速响应规则变化;

  • 多模存储:既能高性能存储海量时序数据,也能完美支持其他业务数据,将多源异构数据统一管理;

  • 流批一体:流计算和批计算共享同一套数据存储和计算引擎,既提高开发效率,又能保证数据一致性;

  • 强大的计算能力:内置 2000+ 函数,支持向量化计算、并行计算,具备复杂规则计算能力;

  • AI 赋能:内置 AI Agent;提供 RAG 的底层支持;内置常用的机器学习算法;可实现 GPU 计算加速。

这些能力如何在电力行业的源、网、荷、储及调度、交易等具体场景中落地?

来共同探讨如何以高性能时序数据库构筑源网荷储数据底座,结合 AI+OR 优化驱动电网调度与现货交易,并分享新一代调度平台的实战经验。

五、典型落地实践

场景一:源侧海量计量点的实时数据治理

某省大约有 3000 万个量测点,每 15 分钟上送一次数据。这些数据是出力评估、电量计算、考核统计的基础。但现场采集的数据有很多问题:飞码(数值突然跳变)、倒走(数值反而变小)、漏采、精度异常等。如果不先做数据治理,后面的业务分析根本没法做。

传统方案是采用阿里云 RDS 存储 + Java 串行识别与拟合:

在这一业务场景下,问题非常典型:RDS + Java 方案查询慢、计算慢、链路长,难以支撑 3000 万计量点和十亿级日增量治理。

而 DolphinDB 则通过分布式存储向量化计算并行处理存算一体,把治理链路统一收敛到数据库内完成:

  • 分布式存储 + 分区裁剪 + 列式计算+向量化存储:把明细曲线与治理结果落在 DolphinDB 分布式表,对于 96 点的明细曲线用向量存储,按日期 / 区域 / 表计等维度分区,避免在 RDS 上做超大范围扫描。

  • 向量化 + 并行计算:异常识别、窗口统计、比例拟合等逻辑用内置向量/矩阵算子一次性批量算;再用并行计算对表计/户号切分任务并发跑。

  • 存算一体:识别、拟合、聚合、写回全部在 DolphinDB 内完成,避免 RDS ↔ Java 反复搬运。

该方案中的数据治理链路大幅缩短,maintenance fee显著降低,原本数小时的处理流程可在分钟级甚至秒级内完成。

场景二:网侧边端实时计算

在变电站中,主变压器是核心一次设备,其运行状态直接影响供电可靠性和设备安全。主变在长期运行过程中,铁芯、绕组、夹件、箱体及附属结构会产生机械振动,这些振动信号中往往包含设备健康状态变化的重要信息。

通过对主变振动信号进行连续采集与在线分析,可以及时发现设备异常征兆,为运维人员提供预警依据,减少突发故障和计划外停电风险。主变振动监测需要能够进行:边缘侧实时处理在线异常识别异常波形自动留存事后故障追溯与诊断

完整的业务流程大致为:TCP 接收 → 报文解析 → 预处理 → 分帧处理 → 快速傅里叶变换(FFT)→ 特征提取 → 异常判定 → 异常原波保留 / 正常降采样存储。

传统方案有两种路径:一是将数据全量上传中心平台统一分析,这会导致网络带宽占用高、边缘到中心延迟不可控,异常发现滞后且难以第一时间留存原始波形,尤其对于瞬态冲击,中心端告警到达时往往已错过异常前后的完整数据;二是在边缘采用 C++ 或 Python 程序配合文件存储,这种架构碎片化严重,接收、分析、告警、存储等模块分散,运维复杂且时延不可控,原始波形存文件、特征数据存时序库,导致异常回放不便、查询链路长,同时 FFT、窗口滑动、规则阈值等逻辑散落在不同程序中,规则调整需改代码、算法更新需重新发布,maintenance fee高。

DolphinDB 的思路是采用“边缘实时分析引擎 + 云端数据存储底座”的架构。变电站工控机上部署 DolphinDB 单机节点,通过 TCPSocket 插件对接采集板,利用内置的 pack/unpack 函数完成 TCP 数据接入与解析,原始帧写入流表作为内存计算载体。该节点以向量化方式完成去均值、加窗、FFT、时域与频域特征提取等异常检测逻辑,并对异常波形进行原始数据保留、对正常波形做降采样处理,同时将告警与特征数据同步至中心侧。中心侧则部署 DolphinDB 集群或分析平台,负责汇总多个变电站的特征数据,统一展示告警与事件,支持异常波形回放、故障分析及长期趋势分析。

这一方案具备以下三点主要优势:

  • 低时延实时计算:DolphinDB 的流计算算子支持增量计算,新数据到达时直接基于已有状态更新,避免全量重算,特别适合 RMS、峰值、频带能量等指标的持续滚动计算;全链路由流计算构建,将异常识别前移到数据进入系统的第一时间,显著缩短从数据到告警的处理时延;

  • 采存算用一体化:DolphinDB 单组件即可实现“接入—计算—判定—分发—存储”一体化处理。多模存储引擎能够同时管理存储原始异常波形、降采样波形、窗口特征、监控规则以及告警数据。这样可以明显降低系统割裂度,减少跨系统搬运与重复开发,提高方案可维护性和可扩展性。

  • 降低资源利用率:增量计算与向量化处理减少了重复计算开销,紧凑的统一处理链避免了多进程并行运行带来的线程切换和内存冗余占用,在仅 2 核 CPU、8GB 内存的边缘工控机上也能稳定运行,实现了“少组件、短链路、少重复计算”的高效架构。

六、结语

此外,DolphinDB 在负荷侧的需求响应与可调负荷聚合运营场景、交易侧的电力交易结算与政策研究场景中也有不少落地实践。

除了电力行业,DolphinDB 在能源、高端制造、公用事业、金融等领域也有广泛应用。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐