服务器 监控(服务器用什么监控软件好)

时间:2023年8月24日下午11:01

很多朋友对于服务器 监控和服务器用什么监控软件好不太懂,今天就由小编来为大家分享,希望可以帮助到大家,下面一起来看看吧!

本文目录

  1. 如何快速实现对Linux服务器的监控
  2. 监控用服务器好还是多台录像机好
  3. 几十台到几千台服务器的运维监控该怎么做
  4. 服务器需要每天监控什么信息
  5. linux服务器监控的几个方法和命令
  6. 服务器用什么监控软件好
  7. 监控服务器怎么配置

如何快速实现对Linux服务器的监控

Linux服务器监控软件有哪些

Cacti:是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具,严格意思是说它只能是监控网络设备。

Zabbix:是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。

Nagios:是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设备,打印机等.

4.Ganglia:是一款为HPC(高性能计算)集群而设计的可扩展的分布式监控系统,简单一点来说就是监控大规模服务器才需要使用到。

优点

Cacti出图比较好,比较适合作交换机和路由器监控。

Zabbix适合中小企业日常部署,监控Linux服务器、Windows服务器、路由器、交换机,报警机制也很友好,可以邮件,微信,短信报警。

Nagios适合中小企业部署使用,监控Linux服务器、路由器、交换机,报警机制有邮件、短信。

Ganglia适合大型企业部署使用,分布式存储,以集群方式来监控,每个区域的Node来监控数据。缺点Catic对服务器监控不好用。

Zabbix对超大型、数据量并发很高的应用监控不好,监控会有延时,精度不够,有些监控参数需要会写监控脚本完成。

Nagios部署比较复杂,没有经验的用户会被折磨。出图效果不佳需要借助于RRDTool工具出图。

Ganglia部署成本较高,需要多台主机,部署相对复杂。

部署Zabbix最为便捷

使用Centos7系统安装LAMP环境搭建一个环境,安装zabbix软件,具体操作如下:

1,安装zabbix源

2,安装Zabbixserver,Web前端

3,安装MySQL源

4,查看可用的Mysql安装源:yumrepolistenabled|grep"mysql.*-community.*"

5,安装MySQL服务:yum-yinstallmysql-community-server

5,启动MySQL服务,并且开机自启动。

6,查看MySQL服务启动正常:

7,查看登陆MySQL密码:yG&t<kt*.3Qt

9,登陆MySQL

8,更改MySQL密码:

9,创建数据库和zabbix用户并授权:

10,导入初始架构和数据

11,检查数据库导入情况

12,先备份配置文档

13,修改配置文件

[root@localhost~]#vim/etc/zabbix/zabbix_server.conf

14,给主目录文档授权

15,启动ZabbixServer服务

16,修改Zabbix默认时区为shanghai

[root@localhost~]#vim/etc/httpd/conf.d/zabbix.conf+20

17,启动Apache服务

18,登陆浏览器操作

最后一步下载php

19,把下载下来的文件上传到/etc/zabbix/,你可以使用rz工具上传这个文件。

20,最后打开登陆页面

总结

以上是我工作中用到感觉最为方便的一款监控软件,希望能够对你有所帮助,也希望能和网络上朋友一起多交流。

监控用服务器好还是多台录像机好

当然是服务器好。

第一,数据安全,一般服务器都做了raid,即使磁盘坏了,也不会丢失数据。

第二,调取录像方便,通过一个平台,一套键盘鼠标就可以调取监控录像。

第三,成本低,如果上千个摄像头,用录像机64路的话要100多个,而服务器只用1个就行,既节省空间,又节省成本。

几十台到几千台服务器的运维监控该怎么做

首先这个问题非常专业,还好我有多年这方面的经验,我就来回答下这个问题吧

服务器在公司的数字业务当中,用来存放或者运行公司的数据业务,充当着至关重要的角色,需要服务器的公司一般少则几台,多则成千上万台,甚至几十万台都有可能!那么就如标题所问的,如何来管理这么多的服务器就成了一个非常重要的问题。

如果企业里只有几台服务器,一台一台的来管理尚可实现,但是一旦到了几十台以上就需要进行专业的管理了!目前国内已经有一些非常优秀的服务器管理软件,我就以我用过的一个给大家做一下功能说明(为了防止打广告嫌疑,我隐去了软件名称):

1、多服务器统一管理

快速查看各个机器实时数据,高效的集中管理服务器,免去来回切换及记录密码的烦恼

2、跨越平台,便捷登录

3、权限分配,安全管理

4、运行数据,一目了然

5、命令群发

6、多服务器数据同步,快速自动备份

这是一般服务器管理软件需要具备的常用功能,当然每个平台还有一些其他的实用功能,我就不在这里赘述,希望我的回答能够对有需要的人起到抛砖引玉的作用!

服务器需要每天监控什么信息

现在所有的企业都基本需要用到服务器,那么服务器的所有信息都应该得到监控,以便管理然而一台服务器每天需要监控的东西其实很多,比如常见的有以下内容:

一、网站故障监控,如果你所运行的项目出现了故障服务器要自动以短信或者邮件提醒的方式通知你,如果没有这个监控,或许等你发现时损失已经很大。

二、服务器性能监控,其实就对服务器(计算机)CPU、内存、硬盘、负载等硬件使用多少的一个监控,如果出现了服务器硬件使用消耗过大那么就要考虑是否升级服务器配置了。

三、网站安全监控,如果网站遭到黑客的攻击这时服务器如果有这项监控那么就会立刻通知你,这时采取相应的措施反攻击,以免自己的网站受到攻击。网站安全可以说是非常重要的,一旦黑客攻击进来你的网站数据丢失,损失就很大了。

四、用户访问速度监控,监控所有访问本服务器的用户的访问速度。

五、备份数据监控,查看网站的备份是否成功,哪些网站备份过、哪些没有。网站备份可以让你的数据有个保存,出现了突发问题可以立马恢复到上一个版本。所以说网站的备份大家也要注重。

六、端口监控,服务器中端口检测也尤为重要,监控服务器开启了哪些端口哪些端口被占用,如果某些端口被一些不知名的IP或者程序占用那么就要考虑是不是服务器中了病毒,被黑客所利用。

以上只是个人观点,不足之处还请大家补充。

linux服务器监控的几个方法和命令

概述

今天主要对mpstat、iostat、sar、vmstat命令做一下总结,这几个命令都是属于运维人员必须掌握的,所以,能不偷懒就不偷懒了。

1、mpstat

mpstat是MultiprocessorStatistics的缩写,是实时监控工具,报告与cpu的一些统计信息这些信息都存在/proc/stat文件中,在多CPU系统里,其不但能查看所有的CPU的平均状况的信息,而且能够有查看特定的cpu信息,mpstat最大的特点是:可以查看多核心的cpu中每个计算核心的统计数据;而且类似工具vmstat只能查看系统的整体cpu情况。

实例:查看多核cpu当前运行的状况,每两秒更新一次,一共更新5次

#mpstat25

说明:

%user在internal时间段里,用户态的CPU时间(%),不包含nice值为负进程(usr/total)*100

%nice在internal时间段里,nice值为负进程的CPU时间(%)(nice/total)*100

%sys在internal时间段里,内核时间(%)(system/total)*100

%iowait在internal时间段里,硬盘IO等待时间(%)(iowait/total)*100

%irq在internal时间段里,硬中断时间(%)(irq/total)*100

%soft在internal时间段里,软中断时间(%)(softirq/total)*100

%idle在internal时间段里,CPU除去等待磁盘IO操作外的因为任何原因而空闲的时间闲置时间(%)(idle/total)*100

2、iostat

iostat用于输出CPU和磁盘I/O相关的统计信息.

语法:

iostat[-c][-d][-h][-N][-k|-m][-t][-V][-x][-z][device[...]|ALL][-p[device[,...]|ALL]][interval[count]]

实例1:

--参数-d表示显示设备磁盘的使用状态;-k表示某些使用block为单位的列强制使用kilobytes为单位,2表示数据每隔2秒刷新一次6表示一共刷新6次

#iostat-d-k26

说明:

tps:该设备每秒的传输次数(Indicatethenumberoftransferspersecondthatwereissuedtothedevice.)。

"一次传输"意思是"一次I/O请求"。多个逻辑请求可能会被合并为"一次I/O请求"。"一次传输"请求的大小是未知的。

kB_read/s:每秒从设备(driveexpressed)读取的数据量;

kB_wrtn/s:每秒向设备(driveexpressed)写入的数据量;

kB_read:读取的总数据量;

kB_wrtn:写入的总数量数据量;这些单位都为Kilobytes。

实例2:

--可以把K单位换成M

#iostat-d-m26

实例3:

--使用iostat查看cpu统计信息使用-C参数

#iostat-c26

实例4:-X参数

--iostat还有一个比较常用的-X参数,该选项将用于显示和io相关的扩展数据。

#iostat-d-x-k16

3、sar

sar(SystemActivityReporter系统活动情况报告)是目前Linux上最为全面的系统性能分析工具之一,可以从多方面对系统的活动进行报告,包括:文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存使用状况、进程活动及IPC有关的活动等,sar命令有sysstat安装包安装。

语法:

sar[options][<interval>[<count>]]

--Optionsare:

-A:所有报告的总和

-b:显示I/O和传递速率的统计信息

-B:显示换页状态

-d:输出每一块磁盘的使用信息

-e:设置显示报告的结束时间

-f:从制定的文件读取报告

-i:设置状态信息刷新的间隔时间

-P:报告每个CPU的状态

-R:显示内存状态

–u:输出cpu使用情况和统计信息

–v:显示索引节点、文件和其他内核表的状态

-w:显示交换分区的状态

-x:显示给定进程的装

-r:报告内存利用率的统计信息

实例1:

--每2秒采样一次,连续4次,观察cpu的使用情况,并将采样的结果以二进制形式存入当前目录下的文件sar中,如下:

#sar-u-osar24

实例2:

--从二进制中调取

#sar-u-f/root/sar

实例3:

--报告每个cpu的状态,1秒一次,一共4次

#sar-p14

实例4:

--查看平均负载

#sar-q

实例5:

--查看内存使用情况

#sar-r

实例6:

--查看系统swap分区的统计信息

#sar-w

实例7:

--磁盘使用统计信息

#sar-d

默认监控:

sar55//CPU和IOWAIT统计状态

(1)sar-b55//IO传送速率

(2)sar-B55//页交换速率

(3)sar-c55//进程创建的速率

(4)sar-d55//块设备的活跃信息

(5)sar-nDEV55//网路设备的状态信息

(6)sar-nSOCK55//SOCK的使用情况

(7)sar-nALL55//所有的网络状态信息

(8)sar-PALL55//每颗CPU的使用状态信息和IOWAIT统计状态

(9)sar-q55//队列的长度(等待运行的进程数)和负载的状态

(10)sar-r55//内存和swap空间使用情况

(11)sar-R55//内存的统计信息(内存页的分配和释放、系统每秒作为BUFFER使用内存页、每秒被cache到的内存页)

(12)sar-u55//CPU的使用情况和IOWAIT信息(同默认监控)

(13)sar-v55//inode,fileandotherkerneltablesd的状态信息

(14)sar-w55//每秒上下文交换的数目

(15)sar-W55//SWAP交换的统计信息(监控状态同iostat的siso)

(16)sar-x290655//显示指定进程(2906)的统计信息,信息包括:进程造成的错误、用户级和系统级用户CPU的占用情况、运行在哪颗CPU上

(17)sar-y55//TTY设备的活动状态

(18)将输出到文件(-o)和读取记录信息(-f)

4、vmstat

vmstat命令是最常见的Linux/Unix监控工具,可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率,内存使用,虚拟内存交换情况,IO读写情况。这个命令是我查看Linux/Unix最喜爱的命令,一个是Linux/Unix都支持,二是相比top,我可以看到整个机器的CPU,内存,IO的使用情况,而不是单单看到各个进程的CPU使用率和内存使用率(使用场景不一样)。

实例1:

--第一个参数是采样的时间间隔数,单位是秒,第二个参数是采样的次数

--如果想在一段时间内一直监控可执行#vmstat2

#vmstat26

说明:

r表示运行队列(就是说多少个进程真的分配到CPU),当这个值超过了CPU数目,就会出现CPU瓶颈了。这个也和top的负载有关系,一般负载超过了3就比较高,超过了5就高

,超过了10就不正常了,服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大,表示你的CPU很繁忙,一般会造成CPU使用率很高。

b表示阻塞的进程

swpd虚拟内存已使用的大小,如果大于0,表示你的机器物理内存不足了,如果不是程序内存泄露的原因,那么你该升级内存了或者把耗内存的任务迁移到其他机器。

free空闲的物理内存的大小

buffLinux/Unix系统是用来存储,目录里面有什么内容,权限等的缓存

cachecache直接用来记忆我们打开的文件,给文件做缓冲

si每秒从磁盘读入虚拟内存的大小,如果这个值大于0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉。

so每秒虚拟内存写入磁盘的大小,如果这个值大于0,同上

bi块设备每秒接收的块数量,这里的块设备是指系统上所有的磁盘和其他块设备,默认块大小是1024byte

bo块设备每秒发送的块数量,例如我们读取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO过于频繁,需要调整。

in每秒CPU的中断次数,包括时间中断

cs每秒上下文切换次数

us用户CPU时间

sy系统CPU时间,如果太高,表示系统调用时间长,例如是IO操作频繁。

id空闲CPU时间

wt等待IOCPU时间。

这种基础命令一定要会,建议大家熟记,后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下~

服务器用什么监控软件好

曾经做过几次大规模服务器监控,下面推荐几款监控软件和辅助软件。

1.zabbix一款老牌经典的监控软件。是一个企业级的分布式开源监控方案。能够实时监控从成千上万台服务器、虚拟机和网络设备中收集到的数以百万计的指标。??

提供图形操作界面,可以方便的添加监控指标、告警指标。支持邮件、微信等的告警通知。

2.Prometheus,近些年监控方面的当红炸子鸡??,Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是GoogleBorgMon监控系统的开源版本。

其优点是轻量级,配置简易,上手简单,丰富的告警模板。

以上是两款监控软件,下面推荐几款监控辅助软件。

1.grafana监控展示界面,在我们获取到监控数据后,可能需要把数据展示出来,给领导们邀功。grafana就是这样一款软件,开源免费,模板丰富。可直接对接zabbixprometheus和mysql数据库等。

2.钉钉机器人。服务器出现告警怎么办,当然是发消息通知运维人员啊。钉钉机器人就提供这么一个功能。在钉钉群里面直接创建机器人,会给我们一个restfull的接口,我们就可以直接发送post请求。原生linux就直接用curl发送,Prometheus提供插件可以直接对接。

监控服务器怎么配置

方法1:Agent服务器监控

1在智能监控平台—cloudeye上新增服务器监控

2选择采集方式:agent监控

采集方式选择agent监控

备注:支持应用程序监控,服务器信息自动添加

3Agent安装与配置

下载linux、windows系统的agent并完成安装、配置。

配置说明:

1)您的有效序列号为w2xr3tlmjryw,请用命令/usr/local/cagent/sbin/startagent-klicense-Hlocalip修改

2)主机性能监控默认开启,应用程序监控需要在/usr/local/cagent/etc/app_task.xml文件中修改配置。

3)配置成功后,服务器自动添加,请耐心等待2分钟

END

方法2:snmp服务器监控

?

选择采集方式:snmp监控

备注:采用snmp监控需保证服务器已开启SNMP服务

服务器配置:

输入所属组、服务器名称、服务器IP、SNMP端口、SNMP协议、SNMPCommunity

好了,关于服务器 监控和服务器用什么监控软件好的问题到这里结束啦,希望可以解决您的问题哈!

二维码
智宇物联平台二维码

搜浪信息科技发展(上海)有限公司 备案号:沪ICP备17005676号