ClickHouse 复制与扩展

核心结论

这篇官方示例把 ClickHouse 的横向扩展讲得很清楚：分片负责扩容，副本负责容灾，Keeper 负责协调，Distributed 表负责跨分片入口。 典型示例是 2 shards × 2 replicas + 3-node Keeper。

文档用 remote_servers 中的 <shard> 与 <replica> 定义集群结构，并把它同时当作 ON CLUSTER 分布式 DDL 的模板。这意味着“拓扑配置”不只是给查询路由看，也是给运维动作看。

当 internal_replication = true 时，写入只会先落到某个 shard 的一个副本，再由复制机制同步到同 shard 的其他副本。也就是说，它避免了客户端向同一 shard 的所有副本重复写入。

文档特别提醒：ON CLUSTER 只适用于 DDL，不适用于 INSERT、UPDATE、DELETE 这类 DML。要跨分片写入，应该创建 Distributed 表，把它当作整个集群的统一入口。

这篇文档让我把“多副本”和“分片”从两个松散词汇变成了明确的职责分工：