首页服务器服务器监控方案,工厂监控方案

服务器监控方案,工厂监控方案

编程之家2023-10-2091次浏览

大家好,今天小编来为大家解答服务器监控方案这个问题,工厂监控方案很多人还不知道,现在让我们一起来看看吧!

服务器监控方案,工厂监控方案

常用的监控协议有哪些

一、监控系统

1、监控系统概念

监控系统应用在监控硬件、软件和业务上,并及时获取相应的数据并分析保存数据,发送报警通知管理者,并自动做出相应的处理,通过接口展示以利于运维人员分析,保证业务的正常运行。

2、运维监控系统具备以下几个模块:

采样:从被监控主机上周期性地获取某个关注指标相关的数据,常见获取数据通道有:ssh/telnet、agent、IPMI、SNMP、JMX等等

存储:用于存储被监控主机采样的数据和分析的数据,利于调用和分析,常用的有mysql、mariadb等数据库

服务器监控方案,工厂监控方案

数据:分析被监控主机采样数据,计算出历史数据、趋势数据、速率、最大最小值等等。

展示:将被监控主机的数据通过图表方式展现出来,利于观察比对,常见的展示接口有:webGUI、GUI、APP等等。

报警:当被监控主机发生异常时,系统用于通知相关人员的报警媒介。常用的报警媒介有:邮件、短信、微信或通过脚本实施。

3、被监控对象:主机、服务器、交换机、路由器、ups等

nms:网络监控主机NMS是移动通信网中的网络管理系统,它的管理对象可以包括网络中所有的实体,如:网络设备、应用程序、服务器系统、路由器、交换机、HUB、辅助设备(如UPS电源)等,给网络系统管理员提供一个全系统的网络视图。

4、监控系统采取的数据通道

服务器监控方案,工厂监控方案

ssh/telnet:安全传输协议

agent方式:代理方式,由监控主机(master)和安装代理进程的被监控主机(agent)组成

ipmi:因特尔智慧平台,硬件监控接口

snmp:简单网络管理协议,版本有 v1,v2(community,pulic)v3

JMX:java管理扩展

jvm:监控java虚拟机

5、储存系统

历史数据:每次采样的结果。保存时长较短

趋势数据:聚合数据,保存时长较长周期内的数据

存储系统:

关系型数据库: mysql pgsql oracle

rrd: roudrobin database

nosql:redis、mongo、时间序列数据库

二、常见的开源监控项目

1、cacti

Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具。

2、nagios

Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设备,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

cacti和nagios这两个功能上有所欠缺

3、ganglia

Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。主要是用来监控系统性能,如:cpu、mem、硬盘利用率, I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。

4、zebbix

功能齐备且好用

zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。

zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。

zabbix由2部分构成,zabbix server与可选组件zabbix agent。

zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux等多种平台上。

三、SNMP协议

1、SNMP概念

SNMP是基于TCP/IP协议族的网络管理标准,是一种在IP网络中管理网络节点(如服务器、工作站、路由器、交换机等)的标准协议。SNMP能够使网络管理员提高网络管理效能,及时发现并解决网络问题以及规划网络的增长。网络管理员还可以通过SNMP接收网络节点的通知消息以及告警事件报告等来获知网络出现的问题。

2、SNMP版本

SNMP主要有三个版本,SNMPv1,SNMPv2,SNMPv3。

SNMPv1是最初始的版本,实现简单,存在较多安全缺陷。

SNMPv2本质上与SNMPv1相同,只是在前一个版本功能上做了加强,并增加了getbulk操作,还增加了一些更加直观的错误响应

SNMPv3解决了两个版本在安全上的问题,采用了USM和VACM技术,增加了更强的认证机制。

目前使用最多的依然是SNMPv1版。有些厂家的IT设备中,还不支持SNMPv3

3、术语

缩略语-------------英文全称--------------中文解释

MIB----Management Information Base------管理信息库

NMS------Network Managerment Station-------网络管理站

OID------Object Identifier-------对象标识符

SNMP------Simple Network Management Protocol--------简单网络管理协议

SMI-----Structure of Management Information------管理信息机构

USM-----User-based Security Model-----基于用户的安全模型

VACM------View-based Access Control Model------基于视图的访问控制模型

PDU------Protocol data unit-------协议数据单元

4、SNMP管理的网络主要由三部分组成:

被管理的设备

SNMP代理

网络管理系统(NMS)

网络结构

网络中被管理的每一个设备都存在一个管理信息库(MIB)用于收集并储存管理信息。通过SNMP协议,NMS能获取这些信息。被管理设备,又称为网络单元或网络节点,可以是支持SNMP协议的路由器、交换机、服务器或者主机等等。

SNMP代理是被管理设备上的一个网络管理软件模块,拥有本地设备的相关管理信息,并用于将它们转换成与SNMP兼容的格式,传递给NMS。

NMS运行应用程序来实现监控被管理设备的功能。另外,NMS还为网络管理提供大量的处理程序及必须的储存资源。

5、MIB管理信息库

IETF规定的管理信息库MIB(由中定义了可访问的网络设备及其属性,由对象识别符(OID:Object Identifier)唯一指定。MIB是一个树形结构,SNMP协议消息通过遍历MIB树形目录中的节点来访问网络中的设备。下图给出了NMS系统中SNMP可访问网络设备的对象识别树(OID:Object Identifier)结构。

网络设备的对象识别树

对一个线路状态进行查询的OID设置例子

工厂监控方案

北京中科航远科公司

企业网络视频监控系统

一、概述:

随着企业的信息化建设不断深入,各企业特别是大中型企业都都加快了信息网络平台的建设;企业正逐步转向利用网络和计算机集中处理管理、生产、销售、物流、售后服务等重要环节的大量数据。

数字视频、音频以其直观性、易于存储、检索和共享,是企业可视信息管理系统的重要组成部分。企业可视管理信息系统是基于网络平台的有关企业安防、生产管理的音视频数据的管理系统,它是传统视频监控系统在功能上的延伸和扩展,在通讯手段上的升级和进步,是未来工业电视、闭路电视系统的发展方向。

二、网络拓扑图:

三、系统组成

1、监控前端主要由前GloVIEW网络视频服务器、摄象机(防护罩、摄象机、镜头、支架)、云台、解码器等主要设备组成。网络视频服务器是整个系统中的核心设备,实现网络化、数字化处理工作,它完成模拟视频监视信号的数字采集、影像压缩、监控数据处理、报警信号的采集、网络的传输等功能。它可将前端的模拟信号同时处理成高清晰的实时数字图像发布到网络中,可实现多用户同时监控相同或者不同的现场图像,真正做到视频共享。

2、后端监控有数台装有专用监控软件的电脑组成,软件功能参考第五节。

四、系统优势

1、可以利用企业内部现有的局域网来传输视频图像,只需要布少量视频线,使整个系统的安装变得非常简单。

2、稳定性好,不死机,使用嵌入式操作系统。

3、不受病毒侵袭,系统采用VXWORKS操作系统,WINDOWS系统的病毒无法入侵。

4、功能齐全,集成度高,具有动态IP功能,短信报警功能,红外/烟感报警功能。

5、企业内部的所有电能都可以看到图像,只要获得授权密码。

6、公司领导出差在外时可以通过INTERNET观看视频图像。

7、系统易扩展。

五、功能介绍:

系统功能:

安全保卫:需在企业厂区门口、厂房、办公楼、周界围墙、仓库等目标进行实时全天候视频监控,且具备报警联动录像功能。

生产管理:及时了解各车间的工作情况和流水线的生产情况,但视频图像必须保密;某些车间因工作环境有害人体健康,需要实现无人作业,这就需要远程监控生产过程。

企业领导管理:领导在办公司利用桌面微机,随时了解各主要生产环节的实时生产状况,处理突发事件,与现场进行双向音视频交流。外出时,可利用上网输入密码登陆进系统,随时了解生产情况。

远程监控:对于跨地区大中型企业,除本地建立网络监控系统外,还需要对分支机构进行集中远程视频监控。

1、多画面监视

1/4/6/8/9/16画面分割模式,支持不规则画面分割,可以通过简单操作实现放大、还原、全屏、图像交换等操作,可以通过拖放摄像机图标实现对不同摄像机图象的监视,简单易用,并且可以拍照、设置图像循环播放等。

2、录象和回放

新版软件在录象上做了很大的改进,新软件在不播放的情况下也可以进行录象,极大的节省了CPU资源,一台P4电脑可以同时记录30~40路图象。

为增强录像的灵活性,软件同时提供了多种录象方式,有移动录象、自动录象、手动录象、单个录象、预置点录象、报警录象等。

移动录象动录象是当服务器检测到现场发生图象运动就自动把现场情况记录下来(例如有人在摄象机前走过,服务器会自动记录到本地计算机上)。

自动录象自动录象是指在软件中设置服务器的录象时间段,当客户端软件所运行的电脑系统时间进入设定的时间段后自动把这一时间段的图象记录下来。

手动录象使用手动录象方式时,只能通过人为地去控制才能起作用,即用户设定某一通到为手动录像机那么只有用户去停止它,它才会停止录像。

单个录象确右击需要录象的某一窗口,在弹出的菜单中选择“单个录象”软件自动把此窗口的图象记录到当前设置盘符的MP4_RecData文件夹中。关闭的时候直接在弹出的菜单中单击“停止录象”即可。

预置点录象是在软件中预先设定摄象机的观测点,当服务器接受到报警信号时触发摄象机快速准确的回到预先设定的状态。一台球机一般最多可以设定63个预置点。

3、独有的短信功能

可以通过专用的手机短信息发送设备将报警信息发送到指定的手机号码上,同时,用户也可以通过普通手机发送短信息开启或停止此功能。

4、动态IP功能

当用户使用ADSL等动态IP接入INTERNET时,只要用户申请注册,我们即可给用户提供的相对静态的“IP”地址,我们将赠送给用户一个用户名,用户只要在我们的软件中输入我们提供的用户名,即相当于输入此用户名相对应的视频服务器的公网IP地址。(此功能相当于为用户提供一个免费的静态公网IP,目前只有本公司的视频服务器具有此功能)

5、断电后自动连接功能

当软件处在播放或者录像状态时,如果此时视频服务器停止供电,那么软件将停止播放图象同时也停止录像,但是如果视频服务器正常供电后,软件将自动连接服务器,同时恢复原来的播放及录像,无须人工干预。

6、远程控制

远程控制云台的上下左右转动,镜头光圈、焦距、变倍的调节,也可以控制远程灯光的控制。

7、远程配置

远程登录到服务器上,配置服务器的各项参数,如修改用户名,密码,IP地址,调节码流等。对服务器,远程升级,远程重启等。

8、状态查看

通过软件可以查看某一服务器上有多少用户在线,分别在观看哪些通到的图像,当前图像的码流是多少等信息。

9、调节码流

根据实际需要设定视频服务器的输出码流大小,支持定码流和变码流。

10、双向语音对讲

即通过电脑可以与远程视频服务器的现成进行双向的语音交流。

11、报警功能

视频服务器可以输入8个报警信号开关,如红外报警,烟感报警等,输出4个报警信号开关,如警笛等。

12、多播功能

在LAN环境下,每一个摄像机允许无限多用户同时访问,并且只占用一个通道的带宽。

13、用户管理功能

系统管理员可以对任意用户的权限进行配置,包括能观看哪些图像,允许何时登入系统,是否有云镜控制功能,并

且对每一用户进行的任何重要操作全部记录数据库中。

如何做好运维监控

统一监控平台,说到底本质上也是一个监控系统,监控的基本能力是必不可少的,回归到监控的本质,先梳理下整个监控体系:

①监控系统的本质是通过发现故障、解决故障、预防故障来为了保障业务的稳定。

②监控体系一般来说包括数据采集、数据检测、告警管理、故障管理、视图管理和监控管理6大模块。而数据采集、数据检测和告警处理是监控的最小闭环,但如果想要真正把监控系统做好,那故障管理闭环、视图管理、监控管理的模块也缺一不可。

一、数据采集

1、采集方式

数据采集方式一般分为Agent模式和非Agent模式;

Agent模式包括插件采集、脚本采集、日志采集、进程采集、APM探针等

非Agent模式包括通用协议采集、Web拨测、API接口等

2、数据类型

监控的数据类型有指标、日志、跟踪数据三种类型。

指标数据是数值型的监控项,主要是通过维度来做标识。

日志数据是字符型的数据,主要是从中找一些关键字信息来做监控。

跟踪型数据反馈的是跟踪链路一个数据流转的过程,观察过程中的耗时性能是否正常。

3、采集频率

采集频率分秒级、分钟级、随机三种类型。常用的采集频率为分钟级。

4、采集传输

采集传输可按传输发起分类,也可按传输链路分类。

按传输发起分类有主动采集Pull(拉)、被动接收Push(推)

按传输链路分类有直连模式、Proxy传输。

其中Proxy传输不仅能解决监控数据跨网传输的问题,还可以缓解监控节点数量过多导致出现的数据传输的瓶颈,用Proxy实现数据分流。

5、数据存储

对于监控系统来说,主要有以下三种存储供选择

①关系型数据库

例如MySQL、MSSQL、DB2;典型监控系统代表:Zabbix、SCOM、Tivoli;

由于数据库本身的限制,很难搞定海量监控的场景,有性能瓶颈,只在传统监控系统常用

②时序数据库

为监控这种场景设计的数据库,擅长于指标数据存储和计算;例如InfluxDB、OpenTSDB(基于Hbase)、Prometheus等;典型监控系统代表:TICK监控框架、 Open-falcon、Prometheus

③全文检索数据库

这类型数据库主要用于日志型存储,对数据检索非常友好,例如Elasticsearch。

二、数据检测

1.数据加工

①数据清洗

数据清洗比如日志数据的清洗,因为日志数据是非结构化的数据,信息密度较低,因此需要从中提取有用的数据。

②数据计算

很多原始性能数据不能直接用来判断数据是否产生异常。比如采集的数据是磁盘总量和磁盘使用量,如果要检测磁盘使用率,就需要对现有指标进行一个简单的四则运算,才能得到磁盘使用率。

③数据丰富

数据丰富就是给数据打上一些tags标签,比如打上主机、机房的标签,方便进行聚合计算。

④指标派生

指标派生指的是通过已有的指标,通过计算得出新的指标。

2.检测算法

有固定规则和机器学习算法。固定算法是较为常见的算法,静态阈值、同比环比、自定义规则,而机器学习主要有动态基线、毛刺检测、指标预测、多指标关联检测等算法。

无论是固定规则还是机器学习,都会有相应的判断规则,即常见的<>>=和and/or的组合判断等。

三、告警管理

1.告警丰富

告警丰富是为了后续告警事件分析做准备,需要辅助信息去判断该怎么处理、分析和通知。

告警丰富一般是通过规则,联动CMDB、知识库、作业历史记录等数据源,实现告警字段、关联信息的丰富;通过人工打Tags也是一种丰富方式,不过实际场景下由于人工成本高导致难以落地。

2.告警收敛

告警收敛有三种思路:抑制、屏蔽和聚合

①抑制

即抑制同样的问题,避免重复告警。常见的抑制方案有防抖抑制、依赖抑制、时间抑制、组合条件抑制、高可用抑制等。

②屏蔽

屏蔽可预知的情况,比如变更维护期、固定的周期任务这些已经知道会发生的事件,心里已经有预期。

③聚合

聚合是把类似或相同的告警进行合并,因为可能反馈的是同一个现象。比如业务访问量升高,那承载业务的主机的CPU、内存、磁盘IO、网络IO等各项性能都会飙升,这样把这些性能指标都聚合到一块,更加便于告警的分析处理。

3.告警通知

①通知到人

通过一些常规的通知渠道,能够触达到人。

这样在没有人盯屏的时候,可以通过微信、短信、邮件触发到工作人员。

②通知到系统

一般通过API推送给第三方系统,便于进行后续的事件处理

另外还需要支持自定义渠道扩展(比如企业里有自己的IM系统,可以自行接入)

四、故障管理

告警事件必须要处理有闭环,否则监控是没有意义的。

最常见还是人工处理:值班、工单、故障升级等。

经验积累可以把人工处理的故障积累到知识库里面,用于后续故障处理的参考。

自动处理,通过提取一些特定告警的固化的处理流程,实现特定场景的故障自愈;比如磁盘空间告警时把一些无用日志清掉。

智能分析主要是通过故障的关联分析、定位、预测等AI算法,进一步提升故障定位和处理的效率;

1.视图管理

视图管理也属于增值性功能,主要是满足人的心理述求,做到心中有底,面向的角色很多(领导、管理员、值班员等)。

大屏:面向领导,提供全局概览

拓扑:面向运维人员,提供告警关联关系和影响面视图

仪表盘:面向运维人员,提供自定义的关注指标的视图

报表:面向运维人员、领导,提供一些统计汇总报表信息,例如周报、日报等

检索:面向运维人员,用于故障分析场景下的各类数据检索

2.监控管理

监控管理是企业监控落地过程中的最大挑战。前5个模块都是监控系统对外提供的服务功能,而监控管理才是面向监控系统自身的管理和控制,关注真正落地的过程的功能呈现。主要有以下几个方面:

配置:简单、批量、自动

覆盖率:监控水平的衡量指标

指标库:监控指标的规范

移动端:随时随地处理问题

权限:使用控制

审计:管理合规

API:运维数据最大的来源,用于数据消费

自监控:自身稳定的保障

为了实现上述监控六大基础能力模块,我们可以按如下架构设计我们的统一监控平台。

主要分三层,接入层,能力层,功能层。

接入层主要考虑各种数据的接入,除了本身Agent和插件的采集接入,还需要支持第三方监控源的数据接入,才能算一个完整的统一监控平台。

能力层主要考虑监控的基础通用能力,包含数据采集模块、数据存储模块、数据加工模块、数据检测模块、AI分析模块。

功能层需要贴近用户使用场景,主要有管理、展示两类功能,在建设的过程中可以不断丰富功能场景。

另外,考虑到数据的关联关系,为未来的数据分析打下基础,监控和CMDB也需要紧密联动,所有的监控对象都应该用CMDB进行管理,另外,还可以配置驱动监控为指导理念,实现监控的自动上下线,告警通知自动识别负责人等场景,简化监控的维护管理。

为了统一监控平台能够在企业更好的落地,我们需要配备对应的管理体系,其中最重要的是指标管理体系。

指标管理体系的核心理念:

监控的指标体系是以CMDB为骨架,以监控指标为经脉,将整个统一监控平台的数据有机整合起来。

贯穿指标的生命周期管理,辅以指标的管理规范,保障监控平台长久有序的运行。

从企业业务应用的视角出发,一般将企业监控的对象分为6层,也可以根据企业自己的情况进行调整:

基础设施层

硬件设备层

操作系统层

组件服务层

应用性能层

业务运营层

关于服务器监控方案的内容到此结束,希望对大家有所帮助。

58同城二手电脑主机?什么渠道可以快速卖出二手主机电脑主机进水了怎么办 电脑机箱进水了怎么办