第一天学 TDengine，我被这个国产时序数据库“秀“到了

houzhe11 · 2026-06-05 16:43:31 发布

写在前面：本文适合对时序数据库感兴趣、想入门 TDengine 的同学阅读。如果你也在犹豫要不要学，希望这篇文章能给你一点动力。

最近圈子里有个名字出现得越来越频繁——TDengine。

作为一个常年和数据库打交道的开发者，我原本对时序数据库的认知还停留在 InfluxDB、Prometheus 这些"洋品牌"上。直到前阵子参加了一个技术沙龙，发现好几个做物联网的朋友都在聊一个国产开源的时序数据库，而且口碑相当不错。

好奇心驱使下，我查了一下：

更关键的是，它主打的就是物联网、工业互联网、车联网这些当下最热的场景。作为一个不想被时代抛下的技术人，我决定：开搞！

于是，就有了这篇"第一天学习笔记"。

先上一段"官方定义"：

TDengine 是一款开源、高性能、云原生的时序数据库（Time-Series Database），专为物联网、工业互联网、车联网、能源等场景优化设计。

翻译成人话就是：它特别擅长处理那种"带时间戳的数据"。

什么叫带时间戳的数据？举个栗子：

这些数据都有一个共同特点：时间是最重要的维度，数据量巨大，但结构相对简单。

传统的关系型数据库（比如 MySQL）处理这种数据会很吃力，而 TDengine 就是为这种场景"量身定制"的。

第一天的学习，我先把重点放在了理解 TDengine 的核心概念上。这几个概念搞懂了，后面的学习会顺畅很多。

这是 TDengine 最亮眼的设计之一。

想象你在管理一个智能电表系统，有 10 万块电表。每块电表都在上报数据：电流、电压、功率、时间戳。

在传统数据库里，你可能要给每块电表建一张表，或者把所有数据塞进一张大表里。前者表太多不好管理，后者查询效率低。

TDengine 的解决方案是——超级表（Super Table，简称 STable）。

你可以先定义一个超级表，规定好所有电表数据的字段结构。然后每块电表对应一张子表，子表继承超级表的字段，但各自独立存储。

超级表：meters
  ├── 子表：d1001（1号电表的数据）
  ├── 子表：d1002（2号电表的数据）
  ├── 子表：d1003（3号电表的数据）
  └── ...（共10万张）

这样一来，既能统一管理表结构，又能保证查询时只扫描相关子表的数据，性能和管理性兼得。这个设计真的很巧妙！

每块电表除了采集的数据（电流、电压等），还有一些静态属性：比如所属区域、设备型号、安装位置。

这些信息在 TDengine 里就叫标签（Tag）。标签是定义在超级表上的，但每个子表可以有自己的标签值。

标签的最大作用是分类和过滤。比如你可以轻松查出"北京市所有 A 型电表的平均功率"，TDengine 会通过标签快速定位到相关子表，而不是全表扫描。

这个很好理解：一个设备（对应一张子表）产生的按时间排序的数据序列，就是一条时间线。

10 万块电表 = 10 万条时间线。TDengine 的架构对海量时间线的支持非常友好，这也是它区别于其他时序数据库的重要优势。

说到时序数据库，很多人第一反应是 InfluxDB。那 TDengine 和它相比，到底强在哪？

我整理了一个简单的对比：

维度	TDengine	InfluxDB
开源协议	AGPL，核心完全开源	核心开源，但企业级集群功能需付费
国产化	✅ 国产，自主可控	❌ 国外产品
写入性能	官方测试最高可达 InfluxDB 的 10 倍以上，单机吞吐可达百万级数据点/秒	高，但集群功能需付费
数据压缩	10:1 甚至更高	一般
SQL 支持	类 SQL，学习成本低	使用 InfluxQL/Flux，需额外学习
数据订阅	内置，支持 Kafka 协议	需借助外部工具
边云同步	原生支持	需自行搭建