特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

Centreon监控超融合集群Proxmox VE（PVE）

来源：互联网收集：自由互联发布时间：2022-06-20

----出自《分布式监控平台Centreon最佳实践》 Proxmox VE（Proxmox Virtual Environment）简称PVE，是一款能与VMware相匹敌的超融合虚拟化平台，其去中心化的特性使整个平台具备更高的可用性，因

----出自《分布式监控平台Centreon最佳实践》

Proxmox VE（Proxmox Virtual Environment）简称PVE，是一款能与VMware相匹敌的超融合虚拟化平台，其去中心化的特性使整个平台具备更高的可用性，因为没有控制中心，集群中的任意节点故障，都不会导致服务不可用。Proxmox VE 6以后的版本，几乎所有的管控操作，都可以在Web管理界面轻松完成，真是系统管理员的福音啊。

Centreon监控超融合集群Proxmox VE（PVE）_Proxmox VE

Proxmox VE正常运行主要涉及corosync服务、pveproxy服务、ceph健康状态，只要这三个条件同时满足，我们就可以大致认为Proxmox VE是正常的。

corosync服务，在系统中有且只有一个进程。

root@pve10:/usr/local/nrpe/libexec#

ps auxww|grep corosync root 2108 1.2 0.0 197332 72504 ? SLsl 2018 17614:34 /usr/sbin/corosync -f

pveproxy服务，此服务为Proxmox VE web管理后台。在系统中有多个进程，同时关联tcp监听端口8006。

Centreon监控超融合集群Proxmox VE（PVE）_Nagios_02

ceph健康状态，在命令行执行“ceph health detail” ，以其输出了解其运行是否正常。

Centreon监控超融合集群Proxmox VE（PVE）_Nagios_03

根据上述三个条件，在目录/usr/local/nrpe/libexec下撰写NRPE插件脚本check_pve，其内容如下：

#!/bin/bash #Writed by sery(vx:formyz) in 2021-07-01 source /etc/profile is_corosync=`ps aux| grep corosync|grep -v grep|wc -l` pve_tcp8006=`netstat -anp| grep pveproxy | grep tcp| wc -l` ceph_health=`ceph health detail| grep HEALTH|awk '{print $1}'` if [[ $is_corosync == 1 ]] && [[ $pve_tcp8006 -ge 1 ]] then if [[ $ceph_health = "HEALTH_OK" ]] then echo "Proxmox ceph VE is OK!" exit 0 elif [[ $ceph_health = "HEALTH_WARN" ]] then echo "Proxmox VE ceph is WARNING" exit 1 else echo "Proxmox Ve is CRITICAL" exit 2 fi fi

在一个运行正常的Proxmox VE集群是运行插件脚本check_pve，其输出结果如下：

Centreon监控超融合集群Proxmox VE（PVE）_分布式监控_04