如何测试服务器的稳定性?

如何测试服务器的稳定性?,第1张

服务器稳定性是最重要的,如果在稳定性方面不能够保证业务运行的需要,在高的性能也是无用的。
正规的服务器厂商都会对产品惊醒不同温度和湿度下的运行稳定性测试。重点要考虑的是冗余功能,如:数据冗余、网卡荣誉、电源冗余、风扇冗余等。
一些测试方法主要分以下几种:
压力测试:已知系统高峰期使用人数,验证各事务在最大并发数(通过高峰期人数换算)下事务响应时间能够达到客户要求。系统各性能指标在这种压力下是否还在正常数值之内。系统是否会因这样的压力导致不良反应(如:宕机、应用异常中止等)。
Ramp Up 增量设计:如并发用户为75人,系统注册用户为1500人,以5%-7%作为并发用户参考值。一般以每15s加载5人的方式进行增压设计,该数值主要参考测试加压机性能,建议Run几次。以事务通过率与错误率衡量实际加载方式。
Ramp Up增量设计目标: 寻找已增量方式加压系统性能瓶颈位置,抓住出现的性能拐点时机,一般常用参考Hits点击率与吞吐量、CPU、内存使用情况综合判断。模拟高峰期使用人数,如早晨的登录,下班后的退出,工资发送时的消息系统等。
另一种极限模拟方式,可视为在峰值压力情况下同时点击事务 *** 作的系统极限 *** 作指标。加压方式不变,在各脚本事务点中设置同集合点名称(如:lr_rendzvous("same");)在场景设计中,使用事务点集合策略。以同时达到集合点百分率为标准,同时释放所有正在Run的Vuser。
稳定性测试:已知系统高峰期使用人数、各事务 *** 作频率等。设计综合测试场景,测试时将每个场景按照一定人数比率一起运行,模拟用户使用数年的情况。并监控在测试中,系统各性能指标在这种压力下是否能保持正常数值。事务响应时间是否会出现波动或随测试时间增涨而增加。系统是否会在测试期间内发生如宕机、应用中止等异常情况。
根据上述测试中,各事务条件下出现性能拐点的位置,已确定稳定性测试并发用户人数。仍然根据实际测试服务器(加压机、应用服务器、数据服务器三方性能),估算最终并发用户人数。
场景设计思想:
从稳定性测试场景的设计意义,应分多种情况考虑:
针对同一个场景为例,以下以公文附件上传为例简要分析场景设计思想:
1)场景一:已压力测试环境下性能拐点的并发用户为设计测试场景,目的验证极限压力情况下测试服务器各性能指标。
2)场景二:根据压力测试环境中CPU、内存等指标选取服务器所能承受最大压力的50%来确定并发用户数。
测试方法:采用1)Ramp Up-Load all Vusers simultaneously
2)Duration-Run Indefinitely
3)在Sechedule-勾选Initalize all Vusers before Run
容错性测试:通过模拟一些非正常情况(如:服务器突然断电、网络时断时续、服务器硬盘空间不足等),验证系统在发生这些情况时是否能够有自动处理机制以保障系统的正常运行或恢复运行措施。如有HA(自动容灾系统),还可以专门针对这些自动保护系统进行另外的测试。验证其能否有效触发保护措施。
问题排除性测试:通过原有案例或经验判断,针对系统中曾经发生问题或怀疑存在隐患的模块进行验证测试。验证这些模块是否还会发生同样的性能问题。如:上传附件模块的内存泄露问题、地址本模块优化、开启Tivoli性能监控对OA系统性能的影响等等。
测评测试是用于获取系统的关键性能指标点,而进行的相关测试。主要是针对预先没有明确的预期测试结果,而是要通过测试获取在特定压力场景下的性能指标(如:事务响应时间、最大并发用户数等)。
评测事务交易时间:为获取某事务在特定压力下的响应时间而进行的测试活动。通过模拟已知客户高峰期的各压力值或预期所能承受的压力值,获取事务在这种压力下的响应时间。
评测事务最大并发用户数:为获取某事务在特定系统环境下所能承受的最大并发用户数而进行的测试活动。通过模拟真实环境或直接采用真实环境,评测在这种环境下事务所能承受的最大并发用户数。判定标准阈值需预先定义(如响应时间,CPU占用率,内存占用率,已出现点击率峰值,已出现吞吐量峰值等)。
评测系统最大并发用户数:为获取整个系统所能够承受的最大并发用户数而进行的的测试活动。通过预先分析项目各主要模块的使用比率和频率,定义各事务在综合场景中所占的比率,以比率方式分配各事务并发用户数。模拟真实环境或直接采用真实环境,评测在这种环境下系统所能承受的最大并发用户数。判定标准阀值预先定义(如响应时间,CPU占用率,内存占用率,已出现点击率峰值,已出现吞吐量峰值等)。取值标准以木桶法则为准(并发数最小的事务为整个系统的并发数)。
评测不同数据库数据量对性能的影响:针对不同数据库数据量的测试,将测试结果进行对比,分析发现数据库中各表的数据量对事务性能的影响。得以预先判断系统长时间运行后,或某些模块客户要求数据量较大时可能存在的隐患。
问题定位测试在通过以上测试或用户实际 *** 作已经发现系统中的性能问题或怀疑已存在性能问题。需通过响应的测试场景重现问题或定义问题。如有可能,可以直接找出引起性能问题所在的代码或模块。
该类测试主要还是通过测试出问题的脚本场景,并可以增加发现和检测的工具,如开启Tivoli性能监控、开启HeapDump输出、Linux资源监控命令等。并在场景运行过程中辅以手工测试。

CPU温度: 正常情况下45-65℃或更低, 高于75-80℃则要检查CPU和风扇间的散热硅脂是否失效、更换CPU风扇或给风扇除尘,部分CPU会自我保护,温度过高会自动降频(一般为标准频率的一半); CPU风扇: 一般1000-2500转左右(可能会因主板或CPU的工作状态不同而动态调整),早期的CPU风扇可能达到3000转或更高,服务器风扇则比一般的要高些,可达到10000转,部分超频专用风扇也可以达到5000转左右,低于500转可能要检查风扇是否正常工作或灰尘过多; 主板温度: 正常情况下40-60℃左右(或更低),视不同的主板品牌、芯片组而定,高于70℃可能要考虑增加机箱风扇或打开机箱, 用外加风扇的方法(比如鸿运扇); 主板风扇: 大多数主板不具备该项功能,只有极少数主板有此功能,具体跟CPU风扇类似,但转速一般会稍微低一些。 显卡温度: 显卡一般是整个机箱里温度最高的硬件,常规下50-70℃(或更低),运行大型3D游戏或播放高清视频的时候,温度可达到100℃左右,一般高负载下不超过110℃均视为正常范畴。如有必要,可适当调高风扇转速。 硬盘温度: 一般情况下30-60℃左右,硬盘经常是机箱里温度最低或第二低的硬件。如果超过70℃则可以考虑加装机箱风扇。

服务器是计算机的一种,在网络中为其它客户机提供计算或者应用服务。具体特点如下:

1、可扩展性

服务器必须具有一定的“可扩展性”,为了保持可扩展性,通常需要在服务器上具备一定的可扩展空间和冗余件(如磁盘阵列架位、PCI和内存条插槽位等)。

2、易使用性

服务器的易使用性主要体现在服务器是不是容易 *** 作,用户导航系统是不是完善,机箱设计是不是人性化,有没有关键恢复功能,是否有 *** 作系统备份,以及有没有足够的培训支持等方面。

3、可用性

可用性,即所选服务器能满足长期稳定工作的要求,不能经常出问题。服务器所面对的是整个网络的用户,而不是单个用户,在大中型企业中,通常要求服务器是永不中断的。为了确保服务器具有高的可用性,除了要求各配件质量过关,还可采取必要的技术和配置措施,如硬件冗余等。

4、易管理性

在服务器虽然在稳定性方面有足够保障,但也应有必要的避免出错的措施,以及时发现问题,而且出了故障也能及时得到维护。这不仅可减少服务器出错的机会,同时还可大大提高服务器维护的效率。

扩展资料:


服务器按体系架构分类:

1、非x86服务器

非x86服务器包括大型机、小型机和UNIX服务器,是使用RISC(精简指令集)或EPIC(并行指令代码) 处理器,并且主要采用UNIX和其它专用 *** 作系统的服务器,精简指令集处理器主要有IBM公司的POWER和PowerPC处理器,SUN与富士通公司合作研发的SPARC处理器等。

2、x86服务器

x86服务器,即通常所讲的PC服务器,它是基于PC机体系结构,使用Intel或其它兼容x86指令集的处理器芯片和Windows *** 作系统的服务器。价格便宜、兼容性好、稳定性较差、安全性不算太高,主要用在中小企业和非关键业务中。

参考资料来源:百度百科-服务器

服务器最低最好保证0度以上,0度以下容易造成无限重启、死机,测试北京最低时候零下十几度也可以工作(新机好一些),严重低温稳定性谁都没法保证,反之高温也一样,超过60度没人能保证能正常使用,室温60度,服务器核心温度就容易超过90度,很危险,随时烧掉

温度范围以及保养方法如下:
“电脑CPU温度跟环境温度有关,夏天温度较高,CPU空闲时候温度在50度以下,普通工作时在65度以下,全速工作时在75度以下。冬天气温较低,CPU温度一般在30度左右。为了能够让电脑保持在高性能状态下工作,首先,就要保养好cpu,并时常进行维护,cpu作为电脑的心脏,它是电脑处理数据的关键部位,所以cpu的性能指标是最关键的,
方法一:散热,cpu在工作状态下会产生很高的热量,正常工作状态下它的温度在35℃~65℃之间,具体情况要根据不用的cpu而定论。所以散热很重要,散热器的质量需要够好,它就能够尽量保持cpu的工作状态,有时候电脑的死机也是由于cpu的温度过高而导致的。
方法二:减压和避震,散热器扣具压力有时候会将cpu的die(既内核)被压毁,在安装散热器时要注意。另外由于散热器的风扇转速很快,这就出现了一个共振问题,这也会使得cpu的die有被磨坏的可能。所以在购买散热器时选择正规知名品牌厂家出产的散热器。
方法三:不过度超频,如今主流cpu的频率都已经够用了,此时超频其意义已不大。所以应该考虑cpu的使用寿命。如果真的需要超频,使用电压超频即可。方法四:灰尘清理,灰尘要及时清理,不要让它影响到cpu,涂抹硅脂时要注意,不要涂抹到外围四周。以免造成短路烧坏cpu。

温度范围以及保养方法如下:
“电脑CPU温度跟环境温度有关,夏天温度较高,CPU空闲时候温度在50度以下,普通工作时在65度以下,全速工作时在75度以下。冬天气温较低,CPU温度一般在30度左右。为了能够让电脑保持在高性能状态下工作,首先,就要保养好cpu,并时常进行维护,cpu作为电脑的心脏,它是电脑处理数据的关键部位,所以cpu的性能指标是最关键的,
方法一:散热,cpu在工作状态下会产生很高的热量,正常工作状态下它的温度在35℃~65℃之间,具体情况要根据不用的cpu而定论。所以散热很重要,散热器的质量需要够好,它就能够尽量保持cpu的工作状态,有时候电脑的死机也是由于cpu的温度过高而导致的。
方法二:减压和避震,散热器扣具压力有时候会将cpu的die(既内核)被压毁,在安装散热器时要注意。另外由于散热器的风扇转速很快,这就出现了一个共振问题,这也会使得cpu的die有被磨坏的可能。所以在购买散热器时选择正规知名品牌厂家出产的散热器。
方法三:不过度超频,如今主流cpu的频率都已经够用了,此时超频其意义已不大。所以应该考虑cpu的使用寿命。如果真的需要超频,使用电压超频即可。方法四:灰尘清理,灰尘要及时清理,不要让它影响到cpu,涂抹硅脂时要注意,不要涂抹到外围四周。以免造成短路烧坏cpu。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/zz/13378530.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-24
下一篇 2023-07-24

发表评论

登录后才能评论

评论列表(0条)

保存