目录标题
- 1️⃣ 基本定义
- 2️⃣ 层级关系
- 3️⃣ PG 的特点
- 4️⃣ 在 PG 模式与 PG + PostgreSQL 模式的区别
- 5️⃣ 简单示意图
- 总结
- 🧩 OceanBase PG 架构示意图(ASCII 图)
- 📌 图示说明
- ✔ 1. Tenant(租户)
- ✔ 2. Table(表)
- ✔ 3. Partition(表分区)
- ✔ 4. **PG = Partition Group(分区组)**
- ✔ 5. Replica(副本)
- 📌 更直观的全流程示意(分布式)
- 📌 为什么 OB 要引入 PG?
1️⃣ 基本定义
- PG = Partition Group(分区组)
- 一个 PG 里面包含若干个副本(Replica),负责存储某一部分表的数据。
- OceanBase 将数据按Tenant → Table → Partition → PG → Replica的层级管理。
2️⃣ 层级关系
| 层级 | 说明 |
|---|---|
| Tenant | 租户,相当于一个数据库实例 |
| Table | 表,属于某个 Tenant |
| Partition | 表的分片(如果表分区) |
| PG | 分区组,每个 PG 存放一个或多个分区的数据副本 |
| Replica | 副本,一个 PG 可以有多个副本(通常 3 个)分布在不同节点上 |
所以 PG 是数据分片的副本集合,是 OceanBase 数据一致性与高可用的最小管理单元。
3️⃣ PG 的特点
高可用
- 一个 PG 通常有 3 个副本(leader + follower + learner)。
- Leader 负责读写请求,Follower 提供备份和读取。
分布式存储
- 不同 PG 的副本分布在不同的 observer 节点上。
- 一个大表可能跨多个 PG,每个 PG 存储表的一部分数据。
数据迁移 / 负载均衡单位
- OB 调度节点做扩容/迁移时,都是以 PG 为单位搬迁数据。
- PG 的迁移不会影响其他 PG 的正常读写。
4️⃣ 在 PG 模式与 PG + PostgreSQL 模式的区别
- OB 有MySQL 模式和PostgreSQL 模式
- PostgreSQL 模式下,你会看到 PG 概念更加明显,因为每个 PG 就是一个逻辑分片 + 副本集合。
- MySQL 模式下,表也会有 PG,但对使用者来说是透明的(你直接访问表即可,PG 在后台管理)。
5️⃣ 简单示意图
Tenant (mysqlt1) └─ Table (user_info) ├─ Partition 1 │ └─ PG 101 │ ├─ Leader Replica -> Node1 │ ├─ Follower Replica -> Node2 │ └─ Follower Replica -> Node3 └─ Partition 2 └─ PG 102 ├─ Leader Replica -> Node2 ├─ Follower Replica -> Node3 └─ Follower Replica -> Node1每个 PG 有自己独立的 Leader/Follower,读写请求会路由到 Leader。
总结
- PG = Partition Group = 分区组 + 副本集合
- PG 是 OB 的最小管理和调度单位
- PG 决定数据的高可用、分布式存储和负载均衡策略
下面给你画一张OceanBase PG(Partition Group)架构的完整示意图,包括 Tenant → Table → Partition → PG → Replica 的关系,清晰直观。
🧩 OceanBase PG 架构示意图(ASCII 图)
┌──────────────────────────────────────────────────────────────┐ │ Tenant: mysqlt1 │ │ (每个租户都有独立的资源 + 数据 + 事务管理) │ └──────────────────────────────────────────────────────────────┘ │ ▼ ┌──────────────────────────────────────────────────────────────┐ │ Table: order_info │ │ (表可能有 0/1/N 个 Partition,视分区策略而定) │ └──────────────────────────────────────────────────────────────┘ │ ▼ ┌──────────────────────────┬──────────────────────────┐ │ Partition 0 │ Partition 1 │ │ (非分区表则只有1个) │ (范围/哈希分区) │ └──────────────────────────┴──────────────────────────┘ │ │ ▼ ▼ ┌──────────────────┐ ┌──────────────────┐ │ PG 1001 │ │ PG 1002 │ │(分区组/最小管理单元)│ │(分区组/最小管理单元)│ └──────────────────┘ └──────────────────┘ │ │ │ │ │ │ ▼ ▼ ▼ ▼ ▼ ▼ ┌────────────┬────────────┬────────────┐ (副本) │ Leader │ Follower │ Follower │ │ Node1 │ Node2 │ Node3 │ └────────────┴────────────┴────────────┘📌 图示说明
✔ 1. Tenant(租户)
OceanBase 多租户架构,每个租户相当于一个“独立的数据库实例”
不同租户之间数据隔离、资源隔离。
✔ 2. Table(表)
一个租户下可以有多张表。
✔ 3. Partition(表分区)
表可能:
- 不分区 → 1 个分区
- Range / List / Hash 分区 → N 个分区
✔ 4.PG = Partition Group(分区组)
PG 是 OB最核心的概念,是最小的数据调度、复制、高可用单元。
每个 PG 下包含多个副本(通常为 3):
- 1 个 Leader(负责事务提交、读写)
- 2 个 Follower(副本 + 提供只读能力)
OceanBase 的数据迁移、均衡、备份、恢复都以PG 为粒度进行。
✔ 5. Replica(副本)
PG 会在多个节点(observer)上放置多个副本:
| 副本类型 | 功能 |
|---|---|
| Leader | 处理写入、强一致读取 |
| Follower | 接收日志同步,用于 HA、高可用 |
| 学习者副本(可选) | 备份或归档使用 |
📌 更直观的全流程示意(分布式)
Tenant ↓ Table ↓ Partition(s) ↓ ┌───────────┐ │ PG │ <--- OceanBase 的最小调度单元 └───────────┘ ↓ ↓ ↓ Replica Leader/Follower 分布三个不同 observer 节点📌 为什么 OB 要引入 PG?
PG 解决分布式数据库的 3 个核心问题:
①高可用
用副本 + Leader 机制实现。
②负载均衡
以 PG 为单位迁移,避免一次性搬迁大表。
③弹性扩容
只需把 PG 迁移到新节点即可。
如果你愿意,我还能:
✅ 画PG 迁移流程图
✅ 画事务在 PG Leader 上执行的流程图
✅ 画备份(Backup Set)与 PG 之间的关系图