服务器故障鉴别及排除的方法
2013-06-25 20:56:57
相比PC而言,服务器出故障的机率是小多了,但是它出故障造成的损失可也大多了。作为服务器维修人员需要了解一些服务器故障恢复的基本知识,知道在维修时可以做些什么来最快速的解决问题也可以减少故障停机时间。
我在这分享的不是一本服务器故障解决的完全手册,但如果能够认真的按照下面的步骤维修维护,它也许可以解决大多数问题,但当你做完所有的这一切仍不管用时,不用惭愧,去找维修专家吧,可以放心的是,这些维修步骤不会出现大的损害,最坏的情形是“It does not work at all”。
本文主要分三部分:第一部分讲的是服务器故障排除的基本原则性问题;第二部分讲述了一些服务器硬件故障排除的实例;第三部分讲述了一些服务器软件故障排除的实例。
第一部分 服务器故障排除的基本原则性问题
一、服务器开机无显示应怎么办
1、检查供电环境,零-火;零-地电压
2、检查电源指示灯,如果亮,正常吗
3、按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗
4、是否更换过显示器,更换另一台显示器
5、去掉增加内存
6、去掉增加的CPU
7、去掉增加的第三方I/O卡
8、检查内存和CPU 插的是否牢靠
9、Clear CMOS
10、更换主要备件,如系统板,内存和CPU
二、服务器故障排错的基本原则是什么
1、尽量恢复系统缺省配置
a:硬件配置:去除第三方厂商备件和非标配备件
b:资源配置:清除CMOS,恢复资源初始配置
c:BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序
d:TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗
2、从基本到复杂
a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理
b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止
c:软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止
3、交换对比
a:在最大可能相同的条件下,交换操作简单效果明显的部件
b:交换NOS载体,既交换软件环境
c:交换硬件,既交换硬件环境
d:交换整机,既交换整体环境
三、服务器故障排除需要收集哪些信息
服务器信息:
1、机器型号
2、机器序列号(S/N:如:NC00075534)
3、Bios 版本
4、是否增加其它设备,如网卡,SCSI 卡,内存,CPU
5、硬盘如何配置,是否做阵列, 阵列级别
6、安装什么操作系统及版本(Winnt 4, Netware, Sco, others)
故障信息:
1、在POST时,屏幕显示的异常信息
2、服务器本身指示灯的状态
3、报警声和BEEP CODES
4、NOS的事件记录文件
5、Events Log 文件
确定故障类型和故障现象:
1、开机无显示
2、上电自检阶段故障
3、安装阶段故障和现象
4、操作系统加载失败
5、系统运行阶段故障
第二部分 服务器硬件故障处理几例
硬件故障是指服务器硬件出现异常而导致的各类错误。由于服务器构成比较复杂,因此在检查的时候必须认真、仔细。下面以一台4500为例说明。(例子,在实际问题中如果遇到相似现象,也需要具体问题具体分析,不要盲目套用)
有一台4500,配有256M内存,使用一个PIII XEON 500带2M高速缓存的处理器。开机后没有任何显示,但系统日志上提示了一条CPU电压为0伏的信息,系统指示灯三灯不停在闪烁(指示灯三灯闪烁是服务器的另一种报警方式,我会在文后说明)。这种错误一般是处理器电压调节模块(VRM)出错或CPU出错或CPU与CPU板块接触不良,但也可能是CPU板块出错,这时情况就比较复杂了,必须经过认真慎重的思考。因为CPU板块在整个服务器中
下一页
返回列表
返回首页
©2024 福州电脑维修/福州电脑上门维修/福州鼓楼星河办公 0591-83786605
Powered by iwms