实践:3个超有用的Linux性能及网络监控工具
我们可能拥有数量众多的服务器、交换机、操作系统、应用程序,那么这些设备或应用并不是一直不发生错误或故障的,它们什么时候发生问题?我们无法得知,而且这些设备或应用保持良好的运行状态对我们来说十分的重要,所以,我们急需一款强大而适合我们的监控工具来替我们看管着这些设备或应用,小编总结了以下4点原因,我们需要监控我们的系统或设备:
1. 服务器、系统、应用程序数量众多,运维人员不大可能使用人工检查;
2. 我们需要这些服务器、交换机、系统和应用程序保持良好的运行状态;
3. 我们需要跟踪所有服务器、系统等设备的资源使用情况,然后适当地调整资源配置;例如,增加磁盘容量等;
4. 数量众多的服务器、系统和应用程序等一旦发生错误或故障可以通过监控工具在第一时间通知运维人员,及时解决问题;
3个超有用的监控工具1、Prometheus
Prometheus是一款100%开源系统监控和报警工具,它以时间序列数据的形式收集并存储度量值,即度量值信息与记录的时间戳一起存储,并与称为标签的可选键值对一起存储。Prometheus原生支持容器平台。
我们需要了解几个Prometheus重要组件,帮助我们更好的学习和掌握Prometheus:
1)Prometheus server:用于收集和存储、检索数据;
2)TSDB:Prometheus自带的时序数据库;
3)指标收集:Exporter(工作方式:拉取)和Pushgateway (工作方式:推送)
4)目标发现:服务发现和静态配置;
5)Alertmanager:告警管理,支持邮件、微信、钉钉和slack等方式;
6)Grafana:(需要独立安装)可视化监控,监控仪表盘,常与Prometheus一起工作;
7)PromQL query:Prometheus一种查询语言,供用户查询相关指标数据;
以上架构图来自Prometheus官网【prometheus.io】
2、Zabbix
Zabbix是一款开源免费的监控工具,被设计为一个IT基础设施监控工具。Zabbix也有一些组件需要我们了解的:
1)zabbix server:负责收集、存储和处理监控数据;
2)zabbix proxy:(可选)代替zabbix server收集数据,部署多个proxy能有效地减轻zabbix server负载;
3)zabbix agent:部署在被监控节点,收集资源和应用指标,并将数据发送给zabbix server;
4)数据库:存储所有配置信息和收集到的数据、告警数据等;
5)Web接口:可视化监控仪表盘,用户可以通过该接口配置和管理被监控节点;
3、Nagios
Nagios也是一款开源免费的监控工具,它可以监视整个IT基础设施,以确保系统、应用程序、服务和业务流程正常运行。在出现故障时,Nagios可以向技术人员发出问题警报。
Nagios提供了许多的插件,所有的监控、检索功能都是通过各种插件来完成的。我们可能需要更多地去了解和使用这些插件:
1)NSCA:NSCA是一个Linux守护进程,它允许您将来自被监控机器和应用程序的被动警报和检查与Nagios集成在一起;
2)SNMP:Nagios允许通过snmp方式收集被监控机器数据;
3)NRPE:允许在其他Linux/Unix机器上远程执行Nagios插件。
4)NSClient++:用于使用Nagios的Windows系统的监视代理/守护进程。
总结1、Prometheus很适合监控容器平台,学习成本会比较高,但功能强大,几乎可以监控所有,可以作为中心化监控中心;
2、Zabbix很适合于监控系统, Windows和Linuxi都有完善成熟的官方模板,直接链接到相应的模板即可完成监控,非常的方便。
3、Nagios很适合监控网络交换机,服务器硬件等,监控界面十分的简洁直观,很多硬件的厂家也有基于nagios的插件,如Nagios监控dell的IDRAC插件: Dell EMC OpenManage Plug-in
本文结束------
如果你觉得这篇文章对你有帮助,请你帮忙点个赞