宕机时间(服务器宕机时间,关键因素之一。)
一、为什么服务器的宕机一般都发生在凌晨使用率最低的时候
来自16年经验老程序员的靠谱回答。
主要有以下几个原因
1.凌晨时服务器很忙
首先,确实服务器的宕机一般都发生在凌晨使用率最低的时候,但是这个使用率只是针对用户而言的。
实际上,在凌晨的时候,服务器是很忙的。主要忙哪些事情呢?主要是一些定时任务,还有数据库备份等。很多比较耗时的操作比如报表统计都会安排在半夜,以免半天影响正常业务,所以这个时候,服务器都是在高负荷运转的,容易产生事故。
2.一般晚上的时候会上线新功能
同理,发布新代码或者更改功能,也会选择在晚上的业务低峰期。无论前期的测试工作做的多么到位,也难免会隐藏一些bug,到了凌晨,这些bug(比如死循环)已经跑了一段时间了,在无人值守的情况下就可能触发各种故障。
如果上线时间比较短还好,遇到更新比较大的情况下,程序员奋战到大半夜,这个情况下人是很疲惫的,更容易忙中出错。
3.无人值守导致修复变慢
比如死循环和内存泄漏,是需要经过一段时间才能表现出来的。白天有人实时监控,自然出现故障的几率比较小,就算出现故障了,也能很快修复,让用户无法觉察。
4.凌晨是黑客作案高峰期
夜黑风高,杀人越货。这个时间点是正常人休息时间,而黑客则选择在这个时候活动,不论是安全攻击,或者是DDOS,都可能造成服务器故障。
二、为什么服务器宕机一般发生在凌晨使用率最低的时候
某些公司需要搞后台研发,经常选择升级的时机放在凌晨,而且大型的数据处理也是放在这个时间段内,经常发生的服务器宕机也是在这个时段。都是在用户使用少的时候开始折腾,折腾的次数多也就容易出现服务器问题。由于做的是物联网设备,在工作中遇到的宕机主要有这么几种情况,对大量数据的操作导致CPU占比在一段时间内骤增从而导致数据接收模块出问题,导致系统监控出现问题,很多设备信息检测不到了。
对数据库的操作太频繁导致效率的下降,也是影响系统性能很重要的一部分,其实服务器也是普通电脑的构成,主要的资源是CPU和内存,这两个因素无论是哪种都有可能导致系统的崩盘,如果是CPU被占满了,系统的反应会变得异常缓慢,时间长了可能还会慢慢缓过劲来,内存如果占满了那么会导致系统的崩溃,直接运行不下去了,其实宕机核心点不会跑出这两种因素。
现在就常见的服务器宕机问题做个归纳总结:
1.磁盘空间被占满,现在程序员运行的时候都习惯于带上log打印,如果时间长了加上没有清理的机制早晚会出问题,这个错误在平时运行过程中经常出现,如果使用的云计算服务器通常在系统崩盘之前都会发个短信,通知你的系统处于崩溃的边缘。
2.并发性能问题,如果多个人同时操作一个数据库或者数据块,会导致系统假死状态,这种属于争抢CPU资源问题,可以通过增加硬件配置以及优化软件代码的效率去解决,数据量如何足够大就可以考虑分布式的管理
3.数据受损或者被破坏导致系统崩盘,所以常见的做法是都会配置备份盘,出现问题抓紧拿到备份盘来顶上,现在公司使用的是阿里云的服务器,稳定性相比之前好太多了,中间换过电信云,腾讯云虽然价格低点,最后受不了直接换成阿里云,再也不想换回去了,数据的稳定性永远是第一位的。
4,一些没有必要的误操作,
很多时候是因为程序员或者运维人员的误操作大致服务器大面积的宕机,这种事件在很多云服务提供商身上都发生过,根本层面还是管理问题。后台管理的任何细节都有可能
服务器宕机查找问题的几个线索:
1.看看服务器是不是存在内存泄漏问题,有些时候重启机器开始还能正常运行弄了一段时间之后就会变得非常缓慢,十有八九都是内存的问题
2.是否有黑客入侵造成,有些非常关键重要的数据也是黑客最感兴趣的,一般来讲这种概率不是很高
三、服务器出现宕机的原因有哪些
①
运行环境:一般来说,此原因是排名第一的服务器宕机类别,运行环境可以看作是支持数据库服务器运行的系统和资源集合,包括操作系统、硬件以及网络等,在运行环境的问题中,最普遍的问题是磁盘空间耗尽。
②服务器性能:最常见的服务器宕机原因是运行SQL,但还有其他的可能,比如也有些问题是由于服务器Bug或错误的行为导致的。
③复制问题:复制问题通常由于主备数据不一致导致。
④数据丢失、损坏:数据丢失问题通常由于错误操作导致,并总是伴随着缺少可用备份的问题,数据丢失一般情况下是由于drop
table的错误操作导致,并总是伴随着缺少可用备份的问题。
|要及时地发现服务器宕机的问题!!!
有一句话说得很好,时间就是金钱,要最快时间发现宕机的问题,例如是否是应用程序导致内存溢出或泄露,是否是进程过多或不断创建、耗尽资源等,是否应用程序异常导致,是否是遭受黑客入侵攻击导致,是否是误操作导致等等,服务器宕机时,为了避免造成不必要的损失,要尽早通知服务商解决相关问题。
|多准备空间
最好准备2个网站空间,它们存放的内容相同,但IP不同,且机房的地理位置不同,这样宕机的可能性就大大降低了,第一时间发现宕机问题后,可以迅速地通过修改域名记录,指向目前正常的网站空间。