ClickHouse 最核心的三类表引擎‌ReplicatedMergeTree、Distributed 和 MergeTree 对比

飞火流星02027

240人浏览 · 2026-04-03 17:53:05

飞火流星02027 · 2026-04-03 17:53:05 发布

ReplicatedMergeTree、Distributed 和 MergeTree表引擎对比表格

维度	‌MergeTree‌	‌ReplicatedMergeTree‌	‌Distributed‌
‌核心作用‌	基础存储引擎，支持高效写入与分区查询	在 MergeTree 基础上实现副本间数据复制	分布式查询路由代理，不存储数据
‌是否存储数据‌	✅ 是	✅ 是（每个副本都存）	❌ 否（仅逻辑视图）
‌数据复制能力‌	❌ 不支持	✅ 支持，通过 ZooKeeper 协调副本同步	❌ 不直接复制数据，依赖底层表
‌分片管理‌	❌ 无分片功能	❌ 仅限单分片内副本同步	✅ 支持跨节点分片，按 sharding_key 分布数据
‌ZooKeeper 依赖‌	❌ 无依赖	✅ 必须依赖 ZooKeeper 或 ClickHouse Keeper	❌ 无直接依赖（但底层 Replicated 表可能依赖）
‌高可用性‌	❌ 单点故障风险	✅ 支持故障转移，副本可自动切换	✅ 查询可路由到健康节点，提升容错
‌写入机制‌	直接写入本地磁盘，异步合并数据片段	写入一个副本，由 ZooKeeper 触发其他副本同步	写入时将数据分发到各分片的本地表
‌读取机制‌	仅读取本节点数据	可从本地副本读取，支持负载均衡策略	广播查询到所有相关分片，汇总结果返回
‌典型使用场景‌	单节点海量数据存储，如日志、时序数据	多副本高可用集群，需数据冗余和容灾	跨分片统一查询入口，构建分布式数据仓库
‌是否支持 ALTER‌	✅ 支持部分操作（如 ADD COLUMN）	✅ 支持，变更通过 ZooKeeper 同步到所有副本	❌ 不适用（无实际数据）
‌数据一致性保障‌	N/A	最终一致性（依赖副本同步进度）	依赖底层表的一致性机制
‌常见搭配方式‌	独立使用或作为本地表基础	作为分片内的复制表，常与 Distributed 配合使用	指向 ReplicatedMergeTree 或 MergeTree 本地表

使用三类引擎建表示例

MergeTree 引擎建表语句示例

CREATE TABLE stable_ai***_metric_value
(
    `ts` DateTime('Asia/Shanghai'),
    `idc` String,
    `province` FixedString(2),
    `province_name` String,
    `province_bm8` String,
    `pod_id` String,
    `metric_name` String,
    `top` Float64,
    `middle` Float64,
    `bottom` Float64,
    `app` String,
    `app_no` String,
    `namespace` String,
    `c_start` FixedString(19),
    `c_end` FixedString(19),
    `period` Int16,
    `time` FixedString(19)
)
ENGINE = MergeTree
PARTITION BY toYYYYMMDD(ts)
PRIMARY KEY (ts,
 idc,
 province,
 app,
 pod_id,
 metric_name)
ORDER BY (ts,
 idc,
 province,
 app,
 pod_id,
 metric_name)
TTL ts + toIntervalDay(7)
SETTINGS index_granularity = 8192;

ReplicatedMergeTree 引擎建表

CREATE TABLE stable_ai***_metric_value
ON CLUSTER ck_cluster
(
    `ts` DateTime('Asia/Shanghai'),
    `idc` String,
    `province` FixedString(2),
    `province_name` String,
    `province_bm8` String,
    `pod_id` String,
    `metric_name` String,
    `top` Float64,
    `middle` Float64,
    `bottom` Float64,
    `app` String,
    `app_no` String,
    `namespace` String,
    `c_start` FixedString(19),
    `c_end` FixedString(19),
    `period` Int16,
    `time` FixedString(19)
)
ENGINE = ReplicatedMergeTree('/clickhouse/tables/{database}/{table}/{shard}', '{replica}')
PARTITION BY toYYYYMMDD(ts)
PRIMARY KEY (ts,
 idc,
 province,
 app,
 pod_id,
 metric_name)
ORDER BY (ts,
 idc,
 province,
 app,
 pod_id,
 metric_name)
TTL ts + toIntervalDay(7)
SETTINGS index_granularity = 8192;

Distributed 引擎建表

CREATE TABLE real_saas_health_degree.stable_ai***_metric_value_distributed
ON CLUSTER ck_cluster
(
    `ts` DateTime('Asia/Shanghai'),
    `idc` String,
    `province` FixedString(2),
    `province_name` String,
    `province_bm8` String,
    `pod_id` String,
    `metric_name` String,
    `top` Float64,
    `middle` Float64,
    `bottom` Float64,
    `app` String,
    `app_no` String,
    `namespace` String,
    `c_start` FixedString(19),
    `c_end` FixedString(19),
    `period` Int16,
    `time` FixedString(19)
)
ENGINE = Distributed(ck_cluster, real_saas_health_degree, stable_aiops_metric_value, rand())

附件一：Clickhouse常用sql

-- 查询集群名
select * from system.clusters 

-- 查看集群分片/副本分布
SELECT * FROM system.clusters WHERE cluster = 'ck_cluster';

-- 检查宏定义值
SELECT * FROM system.macros;

-- 查询所有表名
SELECT * FROM system.tables

附件二：clickhouse集群表删除语句生成语句

SELECT 'DROP TABLE real_saas_health_***.'||name || ' ON CLUSTER ck_cluster SYNC;'
  FROM system.tables 
 WHERE database = 'real_saas_health_***' 
   and engine='ReplicatedMergeTree'