news 2026/2/24 17:22:41

二进制部署监控栈:Prometheus + Alertmanager + Grafana 集成指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
二进制部署监控栈:Prometheus + Alertmanager + Grafana 集成指南

一、安装总体介绍

1.1 需要安装的组件

。vmware虚拟机软件

VMware Workstation是一款功能强大的桌面虚拟计算机软件,提供用户可在单一的桌面上同时运行不同的操作系统,和进行开发、测试、部署新的应用程序的最佳解决方案。VMware Workstation可在一部实体机器上模拟完整的网络环境,以及可便于携带的虚拟机,其更好的灵活性与先进的技术胜过了市面上其他的虚拟计算机软件。对于企业的IT开发人员和系统管理员而言,VMware在虚拟网路,实时快照,拖曳共享文件夹,支持PXE等方面的特点使它成为必不可少的工具。

。centos的linux操作系统

。Prometheus软件

。Grafana软件

1.2 安装步骤

。vmware虚拟机安装(略过)

。centos安装(略过)

。Prometheus的二进制安装

。安装alertmanager

。Grafana软件的安装

。安装node_exporter

二、vmware虚拟机的安装

提前进入到vmware.com的网站(要先有vmware的账号,再登录,再下载次新的vmwareworkstadon pro的版本,此处我们下载17的版本)

三、Centos的安装(我自己用rockylinux9.6)

1.配置静态ip

2.systemctl restart network

3.使用ssh工具连接这台虚拟机

四、Prometheus的二进制安装

4.1 获取安装包

官网:https://www.prometheus.io/download/

#切换到家目录 cd /home #用wget命令从github.com下载指定Prometheus wget https://github.com/prometheus/prometheus/releases/download/v2.45.5/prometheus-2.45.5.linux-amd64.tar.gz #解压 tar -zxvf prometheus-2.45.5.linux-amd64.tar.gz #查看解压后的内容 ll #创建Prometheus目录 mkdir -p /opt/prometheus #移动解压后的文件名到/opt/并改名 mv prometheus-2.45.5.linux-amd64/ /opt/prometheus/prometheus

4.2 创建专门用户

sudo useradd -M -s /usr/sbin/nologin prometheus #更改Prometheus用户的文件夹权限 chown prometheus:prometheus -R /opt/prometheus

4.3 创建系统服务

sudo cat > /etc/systemd/system/prometheus.service << 'EOF' [Unit] Description=Prometheus Server Documentation=https://prometheus.io/docs/introduction/overview/ After=network-online.target [Service] Type=simple User=prometheus Group=prometheus Restart=on-failure ExecStart=/opt/prometheus/prometheus/prometheus \ --config.file=/opt/prometheus/prometheus/prometheus.yml \ --storage.tsdb.path=/opt/prometheus/prometheus/data \ --storage.tsdb.retention.time=60d \ --web.enable-lifecycle [Install] WantedBy=multi-user.target EOF #配置Prometheus的配置文件 #配置Prometheus的数据目录 #配置Prometheus的默认存储天数15天->60天 #配置Prometheus的热加载配置

启动服务

systemctl start prometheus systemctl enable prometheus #查看服务状态 systemctl status prometheus

如有启动问题,进行日志查看&故障排除

journalctl -u prometheus.service -f

4.4 访问地址

#Prometheus(prometheus的服务端口:9090) #如果9090的端口不通,一方面要检查Prometheus的service是否启动,另一方面要检查防火墙 http://192.168.92.11:9090/ #Prometheus的监控指标 http:/192.168.92.11:9090/metrics

五、安装alertmanager

5.1 获取安装包

#下载alertmanager二进制压缩包 wget https://github.com/prometheus/alertmanager/releases/download/v0.27.0/alertmanager-0.27.0.linux-amd64.tar.gz #解压 tar -zxvf alertmanager-0.27.0.linux-amd64.tar.gz #查看解压后的文件名 ll #移动解压后的文件名到/opt/,并改名为alertmanager mv alertmanager-0.27.0.linux-amd64 /opt/prometheus/alertmanager

5.2 更改owner权限

sudo chown -R prometheus:prometheus /opt/prometheus/alertmanager

5.3 创建系统服务

#sudo mkdir -p /opt/prometheus/alertmanager/data sudo cat > /etc/systemd/system/alertmanager.service << 'EOF' [Unit] Description=Alertmanager Documentation=https://prometheus.io/docs/alerting/alertmanager/ Wants=network-online.target After=network-online.target [Service] Type=simple User=prometheus Group=prometheus ExecStart=/opt/prometheus/alertmanager/alertmanager \ --config.file=/opt/prometheus/alertmanager/alertmanager.yml \ --storage.path=/opt/prometheus/alertmanager/data Restart=always [Install] WantedBy=multi-user.target EOF

启动alertmanager

systemctl daemon-reload systemctl start alertmanager.service systemctl enable alertmanager.service #查看alertmanager的服务状态 systemctl status alertmanager.service

5.4 修改prometheus配置

加入alertmanager

#vi /opt/prometheus/prometheus/prometheus.yml alerting: alertmanagers: - static_configs: - targets: - localhost:9093 rule_files: # 根据实际名修改文件名 - "alert.yml"

增加触发器配置文件

cat>/opt/prometheus/prometheus/alert.yml <<"EOF" groups: - name: Prometheus_alert rules: # 对任何实例超过30秒无法联系的情况发出警报 - alert: 服务告警 expr: up == 0 for: 30s labels: severity: critical annotations: instance: "服务异常,实例: {{ $labels.instance }}" description: "{{ $labels.job }} 服务已关闭" EOF

检查配置(prometheus的配置检查的工具)

cd /opt/prometheus/prometheus/ ./promtool check config prometheus.yml

重启prometheus或重新加载配置文件

#重启 systemctl restart prometheus #或重载配置文件,需要--web.enable-lifecycle配置(热加载)(这里两个选一就可以了,这里我选这个) curl -X POST http://localhost:9090/-/reload

5.5 访问地址

http://192.168.92.11:9093/

六、Grafana软件的安装

本次课程选择离线安装包方式,grafana版本10.0.1-1

6.1 上传离线包(清华大学镜像站下载)

grafana-10.0.1-1.x86_64.rpm

#切换到/home目录 cd /home #上传grafana-10.0.1-1.x86_64.rpm ll

6.2 离线包安装,并开机自启动

。离线包安装

yum localinstall grafana-10.0.1-1.x86_64.rpm -y

。开机自启动

systemctl start grafana-server.service systemctl enable grafana-server.service #通过这个命令查看grafana-server服务的状态 systemctl status grafana-server #确认3000端口是否被grafana程序占据 ss -ntulp | grep 3000

6.3 访问图形界面

http://192.168.92.11:3000/

初始密码:admin/admin

七、安装node exporter

7.1 获取安装包

# 1. 下载(使用完整正确的URL) wget https://github.com/prometheus/node_exporter/releases/download/v1.8.0/node_exporter-1.8.0.linux-amd64.tar.gz # 2. 解压 tar -zxvf node_exporter-1.8.0.linux-amd64.tar.gz # 3. (可选)查看解压出的文件夹 ls -l node_exporter-1.8.0.linux-amd64/ # 4. 创建目标目录(如果/opt/prometheus/不存在) sudo mkdir -p /opt/prometheus/ # 5. 移动并重命名(使用下划线,无空格) sudo mv node_exporter-1.8.0.linux-amd64 /opt/prometheus/node_exporter

7.2 更改owner权限

chown prometheus:prometheus -R /opt/prometheus/node_exporter

7.3 创建系统服务

sudo cat > /etc/systemd/system/node_exporter.service << 'EOF' [Unit] Description=Node Exporter Documentation=https://prometheus.io/docs/guides/node-exporter/ After=network-online.target [Service] User=prometheus Group=prometheus ExecStart=/opt/prometheus/node_exporter/node_exporter Restart=on-failure [Install] WantedBy=multi-user.target EOF

启动服务

systemctl daemon-reload systemctl start node_exporter.service systemctl enable node_exporter.service #查看服务状态 systemctl status node_exporter.service

7.4 访问地址

http://192.168.92.11:9100/metrics

7.5 配置Prometheus

#vi /opt/prometheus/prometheus/prometheus.yml #node-exporter配置 - job_name: 'node_exporter' scrape_interval: 15s static_configs: - targets: ['localhost:9100'] labels: instance: 'Prometheus服务器'

重新加载Prometheus配置

curl -X POST http://localhost:9090/-/reload

prometheus的web检查

http://192.168.92.11:9090/

检查status

检查alert

八、配置Grafana

8.1配置Prometheus数据源

。访问grafana

http://192.168.92.11:3000/

。选择配置->Data sources


然后点save & test

8.2 添加node exporter

。访问grafana官网

https://grafana.com/grafana/dashboards/


到这里我们就可以在grafana的数据源当中,对prometheus检测到的数据进行展示

Prometheus 是监控数据的“采集器”和“仓库”,而 Grafana 是查看和分析这些数据的“展示窗口”和“操作台”。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/25 8:05:56

Linly-Talker跨平台兼容性测试报告:Windows/Linux/Mac全支持

Linly-Talker跨平台兼容性测试报告&#xff1a;Windows/Linux/Mac全支持 在虚拟主播深夜直播、企业客服24小时在线、老师远程授课的今天&#xff0c;你有没有想过——这些“人”其实都不是真人&#xff1f;他们可能是由一张照片驱动、用AI生成语音和表情的数字人。而让这一切变…

作者头像 李华
网站建设 2026/2/25 13:03:22

Linly-Talker与阿里云合作推出云端托管服务

Linly-Talker与阿里云合作推出云端托管服务 在智能客服、虚拟主播、远程教育等场景日益普及的今天&#xff0c;企业对“会说话、能思考”的数字人需求正以前所未有的速度增长。然而&#xff0c;传统数字人系统往往依赖高昂的3D建模成本、复杂的动画制作流程和专业的运维团队&a…

作者头像 李华
网站建设 2026/2/24 0:32:03

PHP的opcache.validate_timestamps=1的庖丁解牛

opcache.validate_timestamps1 是 PHP OPcache 扩展中的一个关键配置项&#xff0c;它决定了 OPcache 是否在每次请求时检查 PHP 脚本文件的时间戳&#xff08;filemtime&#xff09;以判断是否需要重新编译。一、核心作用&#xff1a;控制缓存失效的触发条件 当 opcache.valid…

作者头像 李华
网站建设 2026/2/21 4:00:31

Linly-Talker月之暗面Kimi合作洽谈中

Linly-Talker月之暗面Kimi合作洽谈中&#xff1a;技术解析与应用展望 在虚拟主播24小时不间断带货、AI客服秒回千条咨询的今天&#xff0c;数字人早已不再是科幻电影里的概念。它正以惊人的速度渗透进直播、教育、政务等现实场景。然而&#xff0c;大多数企业仍被高昂的制作成本…

作者头像 李华
网站建设 2026/2/25 11:40:46

Linly-Talker在客服场景的应用:7x24小时数字员工上岗

Linly-Talker在客服场景的应用&#xff1a;7x24小时数字员工上岗 在金融、电信和电商等行业&#xff0c;客服中心每天要处理成千上万的用户咨询。然而&#xff0c;面对高峰期排队久、夜间无人应答、服务标准不一等问题&#xff0c;企业越来越意识到&#xff1a;仅靠人力难以维持…

作者头像 李华
网站建设 2026/2/23 15:37:59

Linly-Talker为何成为开发者首选的数字人框架?

Linly-Talker为何成为开发者首选的数字人框架&#xff1f; 在虚拟主播直播间里&#xff0c;一个面容逼真的数字人正用自然流畅的语音回答观众提问&#xff0c;口型与语调严丝合缝&#xff0c;表情随情绪微妙变化——这不再是科幻电影的桥段&#xff0c;而是越来越多开发者借助 …

作者头像 李华