news 2026/5/27 18:45:04

ceph简介及部署安装

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ceph简介及部署安装

Ceph 分布式存储简介

Ceph 简介

Ceph 是一款开源、分布式、软件定义存储 。
Ceph 具备极高的可用性、 扩展性和易用性, 用于存储海量数据。
Ceph 存储可部署在通用服务器上, 这些服务器的CPU可以是x86架构, 也可以是ARM架构。
Ceph 支持在同一集群内既有x86主机,又有ARM 主机。
软件定义 software-defined storage (SDS)

Ceph访问方式-简介

Ceph提供以下访问Ceph集群的方法:
Ceph原生API(librados)
Ceph块设备(RBD、librbd),也称为 RADOS块设备(RBD)镜像
Ceph对象网关(RADOSGW、librgw)
Ceph文件系统(CephFS、libcephfs)

Ceph存储后端组件-简介

监控器(MON)维护集群状态映射。它们可帮助其他守护进程互相协调。
对象存储设备(OSD)存储数据并处理数据复制、恢复和重新平衡。
管理器(MGR)通过基于浏览器的仪表板和RESTAPI,跟踪运行时指标并公开集群信息。
元数据服务器(MDS)存储CephFS使用的元数据(而非对象存储或块存储),以便客户端能够高效运
行 POSIX命令。

Ceph 分布式存储 部署过程

Ceph 集群环境说明

部署方法:cephadm
操作系统:Centos Stream 8(最小化安装)
硬件配置:2 cpu、4G memory、1个系统盘+3个20G scsi数据盘

准备虚拟机模板

基于 CentOS-Stream-8-template 模板克隆出 ceph-template

# 1 配置主机名解析[root@localhost ~]# cat >> /etc/hosts << EOF###### ceph ######192.168.108.10 client.zhu.cloud client192.168.108.11 ceph1.zhu.cloud ceph1192.168.108.12 ceph2.zhu.cloud ceph2192.168.108.13 ceph3.zhu.cloud ceph3 EOF# 2 关闭 SELinux[root@localhost ~]# sed -ri 's/^SELINUX=.*/SELINUX=disabled/g'/etc/selinux/config# 3 关闭防火墙[root@localhost ~]# systemctl disable firewalld --now# 4 配置yum仓库[root@localhost ~]# cat << 'EOF' > /etc/yum.repos.d/ceph.repo[Ceph]name=Cephbaseurl=https://mirrors.aliyun.com/centos-vault/8-stream/storage/x86_64/cephpacificenabled=1gpgcheck=0EOF# 5 安装基础软件包[root@localhost ~]# dnf install -y bash-completion vim lrzsz unzip rsync sshpass tar# 6 配置时间同步[root@localhost ~]# dnf install -y chrony[root@localhost ~]# systemctl enable chronyd --now# 7 安装 cephadm[root@localhost ~]# dnf install -y cephadm[root@localhost ~]# cephadm --helpusage: cephadm[-h][--image IMAGE][--docker][--data-dir DATA_DIR][--log-dir LOG_DIR][--logrotate-dir LOGROTATE_DIR][--sysctl-dir SYSCTL_DIR][--unit-dir UNIT_DIR][--verbose][--timeout TIMEOUT][--retry RETRY][--env ENV][--no-container-init]{version,pull,inspect-image,ls,list-networks,adopt,rm-daemon,rmcluster,run,shell,enter,ceph-volume,zap-osds,unit,logs,bootstrap,deploy,checkhost,prepare-host,add-repo,rm-repo,install,registry-login,gatherfacts,exporter,host-maintenance,disk-rescan}... Bootstrap Ceph daemons with systemd and containers. positional arguments:{version,pull,inspect-image,ls,list-networks,adopt,rm-daemon,rmcluster,run,shell,enter,ceph-volume,zap-osds,unit,logs,bootstrap,deploy,checkhost,prepare-host,add-repo,rm-repo,install,registry-login,gatherfacts,exporter,host-maintenance,disk-rescan}sub-command version get ceph version from container pull pull the default container image inspect-image inspectlocalcontainer imagelslist daemon instances on thishost......# 安装 cephadm 的时候,会自动安装官方推荐的容器引擎 podman[root@localhost ~]# rpm -q podmanpodman-4.9.4-0.1.module_el8+971+3d3df00d.x86_64# 8 提前下载镜像[root@localhost ~]#podmanpull quay.io/ceph/ceph:v16podmanpull quay.io/ceph/ceph-grafana:8.3.5podmanpull quay.io/prometheus/node-exporter:v1.3.1podmanpull quay.io/prometheus/alertmanager:v0.23.0podmanpull quay.io/prometheus/prometheus:v2.33.4# 准备配置主机脚本[root@localhost ~]# cat > /usr/local/bin/sethost <<'EOF'#!/bin/bashhostnamectl set-hostname ceph$1.zhu.cloud nmcli connection modify ens160 ipv4.method manual ipv4.addresses192.168.108.1$1/24 ipv4.gateway192.168.108.2 ipv4.dns192.168.108.2 init0EOF##添加可执行权限[root@localhost ~]# chmod +x /usr/local/bin/sethost

关机虚拟机,并打快照

准备集群节点

克隆出其他虚拟机,并配置主机名和IP地址。

##之前模板配置好脚本,直接运行脚本配置#ceph1到ceph3按以下修改[root@localhost ~]# sethost 1 #ceph1用1

Ceph 集群初始化

[root@ceph1 ~]# cephadm bootstrap --mon-ip 192.168.108.11 --allow-fqdn-hostname --initial-dashboard-user admin --initial-dashboard-password xxxxx --dashboard-password-noupdate##初始化时会输出内容,网站用户名密码会显示在输出内容里面

–mon-ip 192.168.108.11,指定 monitor ip。
–allow-fqdn-hostname,指定允许使用长名称。当主机名是长名称时,初始化时必须使用该参
数。
–initial-dashboard-user admin,指定 Web UI 登录的管理员账户。
–initial-dashboard-password ,指定 Web UI 登录的管理员账户对应密码。
–dashboard-password-noupdate,指定不要更新 Web UI 登录密码。
随后登陆网站

添加节点

添加节点过程:

  1. Ceph采用共享秘钥进行身份验证, 使用命令“ceph cephadm get-pub-key” 获取到主机接入集群时
    所需的ssh 公钥。
  2. 获取到公钥后, 使用该公钥实现对节点的免密ssh管理。
  3. 使用命令“ceph orch host add” 添加主机。
# 为了配置方便,我们在ceph1上安装ceph客户端工具 ceph-common[root@ceph1 ~]# dnf install -y ceph-common# 获取集群公钥[root@ceph1 ~]# ceph cephadm get-pub-key > ~/ceph.pub# 推送公钥到其他节点[root@ceph1 ~]# ssh-copy-id -f -i ~/ceph.pub root@ceph2.zhu.cloud[root@ceph1 ~]# ssh-copy-id -f -i ~/ceph.pub root@ceph3.zhu.cloud# 添加节点[root@ceph1 ~]# ceph orch host add ceph2.zhu.cloudAddedhost'ceph2.zhu.cloud'with addr'192.168.108.12'[root@ceph1 ~]# ceph orch host add ceph3.zhu.cloudAddedhost'ceph3.zhu.cloud'with addr'192.168.108.13'[root@ceph1 ~]# ceph orch host lsHOST ADDR LABELS STATUS ceph1.zhu.cloud192.168.108.11 _admin ceph2.zhu.cloud192.168.108.12 ceph3.zhu.cloud192.168.108.133hostsincluster# 等待自动部署服务到其他节点,部署完成后效果如下:[root@ceph1 ~]# ceph orch lsNAME PORTS RUNNING REFRESHED AGE PLACEMENT alertmanager ?:9093,90941/1 8m ago 9m count:1 crash3/3 8m ago 9m * grafana ?:30001/1 8m ago 9m count:1 mgr2/2 8m ago 9m count:2 mon3/5 8m ago 9m count:5 node-exporter ?:91003/3 8m ago 9m * prometheus ?:90951/1 8m ago 9m count:1# crash 3/3个# mgr 2/2个# mon 3/5个# node-exporter 3/3个

部署 mon 和 mgr

# 禁用 mon 和 mgr 服务的自动扩展功能[root@ceph1 ~]# ceph orch apply mon --unmanaged=true[root@ceph1 ~]# ceph orch apply mgr --unmanaged=true[root@ceph1 ~]# ceph orch lsNAME PORTS RUNNING REFRESHED AGE PLACEMENT alertmanager ?:9093,90941/1 56s ago 12m count:1 crash3/3 57s ago 12m * grafana ?:30001/1 56s ago 12m count:1 mgr2/2 57s ago 3s<unmanaged>mon3/5 57s ago 8s<unmanaged>node-exporter ?:91003/3 57s ago 12m * prometheus ?:90951/1 56s ago 12m count:1# mon 和 mgr 的 PLACEMENT 状态为 <unmanaged># 配置主机标签,ceph2 和 ceph3 添加标签“ _admin”[root@ceph1 ~]# ceph orch host label add ceph2.zhu.cloud _adminAdded label _admin tohostceph2.zhu.cloud[root@ceph1 ~]# ceph orch host label add ceph3.zhu.cloud _adminAdded label _admin tohostceph3.zhu.cloud[root@ceph1 ~]# ceph orch host lsHOST ADDR LABELS STATUS ceph1.zhu.cloud192.168.108.11 _admin ceph2.zhu.cloud192.168.108.12 _admin ceph3.zhu.cloud192.168.108.13 _admin3hostsincluster# 将 mon 和 mgr 组件部署到具有_admin标签的节点上[root@ceph1 ~]# ceph orch apply mon --placement="label:_admin"Scheduled mon update...[root@ceph1 ~]# ceph orch apply mgr --placement="label:_admin"Scheduled mgr update...#观察现象[root@ceph1 ~]# ceph orch ls | egrep 'mon|mgr'mgr3/3 2m ago 14s label:_admin mon3/3 2m ago 28s label:_admin

部署 OSD

# 将所有主机上闲置的硬盘添加为 OSD[root@ceph1 ~]# ceph orch apply osd --all-available-devicesScheduled osd.all-available-devices update...

验证

查看集群中部署的服务

[root@ceph1 ~]# ceph orch lsNAME PORTS RUNNING REFRESHED AGE PLACEMENT alertmanager ?:9093,90941/1 42s ago 2h count:1 crash3/3 42s ago 2h * grafana ?:30001/1 42s ago 2h count:1 mgr3/3 42s ago 2h label:_admin mon3/3 42s ago 2h label:_admin node-exporter ?:91003/3 42s ago 2h * osd.all-available-devices942s ago 2h * prometheus ?:90951/1 42s ago 2h count:1

查看集群状态

[root@ceph1 ~17:08:27]# ceph -scluster: id: bdee4f9e-5996-11f1-8dce-000c294cc7b5 health: HEALTH_OK##okservices: mon:3daemons, quorum ceph1.zhu.cloud,ceph2,ceph3(age 52m)mgr: ceph1.zhu.cloud.fvwqgp(active, since 52m), standbys: ceph3.nytnqr, ceph2.noelbi osd:9osds:9up(since 52m),9in(since 2h)data: pools:1pools,1pgs objects:0objects,0B usage:2.6GiB used,177GiB /180GiB avail pgs:1active+clean#HEALTH_OK:表示健康状态良好#HEALTH_WARN:表示集群存在告警,需进行排查处理后,可转为HEALTH_OK#HEALTH_ERR:表示集群存在比较严重的错误,需要立即处理

查看集群 osd 结构

[root@ceph1 ~17:10:48]# ceph osd treeID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF-10.17537root default-30.05846hostceph10hdd0.01949osd.0 up1.000001.000003hdd0.01949osd.3 up1.000001.000006hdd0.01949osd.6 up1.000001.00000-70.05846hostceph22hdd0.01949osd.2 up1.000001.000005hdd0.01949osd.5 up1.000001.000008hdd0.01949osd.8 up1.000001.00000-50.05846hostceph31hdd0.01949osd.1 up1.000001.000004hdd0.01949osd.4 up1.000001.000007hdd0.01949osd.7 up1.000001.00000

查看集群组件


集群中运行的主要组件:
mgr,ceph 管理程序
monitor,ceph 监视器
osd,ceph 对象存储进程
rgw,ceph 对象存储网关
其他组件:
crash,崩溃数据收集模块
prometheus,监控组件
grafana,监控数据展示dashboard
alertmanager,prometheus告警组件
node_exporter,prometheus节点数据收集组件

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/27 18:44:19

告别第三方软件:利用DDNS与端口映射打造专属远程桌面方案

1. 为什么你需要自建远程桌面方案&#xff1f; 每次打开第三方远程控制软件&#xff0c;是不是总遇到卡顿、收费弹窗或者隐私担忧&#xff1f;我曾经也深受其害。去年疫情期间在家办公&#xff0c;用某知名远程软件连接公司电脑&#xff0c;关键时刻突然提示"免费用户时长…

作者头像 李华
网站建设 2026/5/27 18:44:00

c#基础6

进程与线程的一个简单解释 - 阮一峰的网络日志 进程和线程的理解 多线程编程 进程 主线程和分线程关系 一个程序就是一个进程&#xff0c;然而进程里面包含若干个线程&#xff0c;而每个进程里面都有一个&#xff08;可以说必须要有一个&#xff09;线程&#xff0c;这…

作者头像 李华
网站建设 2026/5/27 18:41:59

量子计算多程序编译技术DYNAMO解析与应用

1. 量子计算中的多程序编译挑战与突破量子计算正从实验室走向实际应用&#xff0c;但硬件资源的稀缺性始终是制约发展的瓶颈。在中性原子量子计算架构中&#xff0c;我们面临一个关键矛盾&#xff1a;量子比特数量有限与多任务并发需求之间的矛盾。传统单程序编译模式导致硬件利…

作者头像 李华
网站建设 2026/5/27 18:41:07

太赫兹通信性能评估:α-µ衰落信道与硬件损伤联合建模分析

1. 太赫兹无线通信&#xff1a;从理论到现实的性能鸿沟如果你正在设计下一代超高速无线通信系统&#xff0c;比如6G或者超高清无线VR/AR的传输链路&#xff0c;那么太赫兹&#xff08;THz&#xff09;频段一定是你绕不开的技术选项。这个介于毫米波和红外光之间的“最后一片处女…

作者头像 李华
网站建设 2026/5/27 18:40:19

深度解析:Arduino-ESP32如何重塑嵌入式开发体验

深度解析&#xff1a;Arduino-ESP32如何重塑嵌入式开发体验 【免费下载链接】arduino-esp32 Arduino core for the ESP32 family of SoCs 项目地址: https://gitcode.com/GitHub_Trending/ar/arduino-esp32 当我们探索物联网设备开发时&#xff0c;常常面临一个技术困境…

作者头像 李华