分类:电脑
前言
在此前的一些时间,我也曾经写过一些关于硬盘存储器的文章。尔后的一些时间里我一直没有动笔,在这段时间里主要是对自己的相关知识做一些总结和提炼,并且尽可能地进行了一些实际的动手操作和实验。
经过很长时间的酝酿和筹划,今天终于开始写这篇关于硬盘的文章。总体预计分为两个部分,一是硬盘工作的原理,另一则是典型故障的处理。可能这样会使得这篇文章显得略显晦涩,大家也急于看到故障处理方面的经验,但是我还是坚持要将硬盘的原理放到前面来讲。硬盘是机电一体化、现代制造技术的典型产品,如果不能对其结构有一个基本的了解,即便是学会了修一两个盘,也不能做到举一反三。不论是对普通的
DIYer还是维修从业者,都是没有好处的。
前言
在此前的一些时间,我也曾经写过一些关于硬盘存储器的文章。尔后的一些时间里我一直没有动笔,在这段时间里主要是对自己的相关知识做一些总结和提炼,并且尽可能地进行了一些实际的动手操作和实验。
经过很长时间的酝酿和筹划,今天终于开始写这篇关于硬盘的文章。总体预计分为两个部分,一是硬盘工作的原理,另一则是典型故障的处理。可能这样会使得这篇文章显得略显晦涩,大家也急于看到故障处理方面的经验,但是我还是坚持要将硬盘的原理放到前面来讲。硬盘是机电一体化、现代制造技术的典型产品,如果不能对其结构有一个基本的了解,即便是学会了修一两个盘,也不能做到举一反三。不论是对普通的
DIYer还是维修从业者,都是没有好处的。
硬盘的历史与基本原理
机械式存储器的发展历史
我得承认,在所有的计算机部件中,不管是目前热门的还是数十年前就已经淘汰的,机械式存储器是最令我着迷的。不管是磁芯、软盘、光盘、磁光盘、或者是硬盘,她们对我有着无穷的吸引力。机械式的存储器有着深厚的技术积累,而最早的产品自动的机械式的存储介质,可能是留声机上的石蜡桶。通过刻录在石蜡桶上的凹坑,经过唱针放大而还原为原始的声音信号。并且蜡桶很快被圆盘形的唱片所代替。很有意思的是,最早的计算机磁存储器:磁鼓,也是桶形的,并也很快地被磁盘所取代了。随后又经过很长一段时间的发展,终于形成了硬盘目前的存储形式。
硬盘的机械结构
在机械机构方面上,硬盘的功能部件主要有盘片和磁头两个部分。盘片通过直流无刷电机与底座连接在一起;磁头则在音圈电机控制下定位于盘片上方。当磁盘旋转时,磁头可以扫描到盘片上的任意位置。同时,由于盘片高速旋转所产生的空气薄膜磁头可以在离盘片1微米左右的距离悬浮。为了保证磁头悬浮高度的稳定,盘腔中的空气也必须极为洁净,盘片和磁头的表面都必须特别光滑。有些硬盘的磁头由于过于光洁甚至会因大气力压粘连在盘片表面,(为解决此问题必须对盘片一些部位作特殊处理)其表面光滑滑程度之甚可见一斑。
盘片的电机多为恒转速的直流无刷电机,皆为三相直流供电。但是分为三角形连接、星形无中线和星形有中线等三种线圈绕法,故前两种电机为三抽头后一种电机为四抽头。这种电机可以比较精确的控制转速,让盘片稳定地旋转。而控制磁头的音圈电机则比较复杂,线圈中流过的电流控制了磁头的运动方向。当磁头需要移动位置时线圈中被通过很大电流,磁头发生偏转;当磁头接近指定位置时,线圈中的电流减弱甚至反向流动,磁头开始减速。以类似的方式,磁头一级一级地靠近指定位置,直到正确定位。在静止状态下,磁头也在不停修正自己的位置,杜绝定位错误。
硬盘的电子结构
硬盘的控制与数据传递是一项繁重的工作,所以不能由计算机的CPU进行控制,而靠硬盘本身的控制器与计算机主机相通讯,实际上也就是通过一个单片机(mcu)配合DSP进行逻辑程序控制。单片机有自己的存储区(EEPROM)和内存(RAM)。但是单片机的ROM通常不会很大,所以我们经常在硬盘的PCB上看到类似闪存芯片的东西,这就是单片机的扩展ROM。但是这些存储空间对于控制硬盘的单片机还是不够,为了避免成本的增加。工程技术人员只将最基本的启动初始化程序装入PCB的ROM,其他的数据比如磁盘大小和型号SMART信息则写入硬盘的保留区。这个区对于用户来说是不可见的,通常也是不可操作的。待启动硬盘以后,单片机根据ROM中的程序调用保留区的信息,对硬盘进行二次初始化。
形象地讲,硬盘就像一个小电脑。ROM中的程序就像是主板的BIOS,系统保留区的数据就像是操作系统。其最终的目的就是为了控制硬盘进行正确的数据IO。
硬盘的损坏与维修。
硬盘的损坏我们暂且可以笼统地分为四类,机械机构损坏、电路损坏、固件错乱、产生坏道。四种故障每一种都很常见,有必要结合实例一项一项的说明。我们假设主板BIOS、操作系统及硬件部分的配置正确无误。当判定硬盘故障和着手维修硬盘时,建议将硬盘稳妥地放置在机箱外并连接到计算机中,最好放在厚实的木板上。这样可以杜绝静电和短路,并且可以比较容易通过声音找到硬盘的故障所在。
机械结构损坏
对于机械式存储器来说,机械部件的损坏是不可避免的。机械损坏可能有很多种,比叫典型的有
1.跌落造成的盘片移动(磁道不再是以主轴为中心的同心圆)
2.磁头的错位(希捷硬盘中比较常见,读取头损坏的现象通常都是磁头不停的敲打,不能正确定位。好像也有开机静止不动的)
3.磁头过热损坏(几个小时的连续低级格式化有可能造成这种情况)或静电击穿
4.硬盘的电路板与电机、磁头的触点基础不良。
5.断电时磁头没有正确回到启停区,导致卡死盘片,下次开机时硬盘不能初始化。导致BIOS找不到硬盘。
根据经验,只有第四、第五种情况是比较容易维修的,也是在不需要数据恢复时唯一值得维修的。
第四种情况在IBM腾龙硬盘中比较常见,清理后重新固定电路板即可。
第五种情况的硬盘通常加电时不会有正常的启动声音。(启动时的声音分两个部分:一个是电机起转,声音由低到高、另一个是转速稳定后磁头初始化产生的声音。这个过程是磁头由最里侧启停区移动到最外侧的系统保留区,再由外到里扫描盘片,再回到0磁道。找一个正常的硬盘,仔细听她的启动过程,你会明白我说的是什么意思)这种硬盘由于盘片被卡住,所以没有盘片的转动声,只有一种呲呲的振动声。而且硬盘拿在手中感觉不到启动时由于盘片转动造成的冲击。(而且正常工作的硬盘在盘片中由于产生陀螺效应,拿在手中会感觉很"顽固",略感不容易改变放置方向)。
遇到这种情况,必须要开盘处理。打开的方法相信不用多说,只需旋开所有螺丝起开上盖。但是相信开盘的顾虑是所有人都有的。百级无尘,在我们当中几乎没有人有这个条件。但其实不用怕,即使我们连万级无尘室也没有,依然不影响我们修理自己手中的硬盘。找一个房间,窗明几净的那种最好。不要听信浴室雾气除尘那种鬼话,那会让一切变得更糟。不过自己还是要去洗一个澡,洗去身上的油脂和皮屑,尤其是头发和手一定要处理干净。通常在硬盘上要用到的是六棱扳手,尤其以T-8型号的最多。建议从T-5到T-9买一套回来,如果你有兴趣修理硬盘这一套东西是不可少的。老式电脑用的AT电源最好也有一个,自己用ATX的改装也可以,不过最好能加装一个开关。如果你认为有必要的话,来一小点哥俩好粘胶,最后我们会有妙用。
把电源开关关闭,连接好硬盘电源线。打开硬盘的上盖,不用紧张。如果看到磁头位置不在最里侧的启停区,就可以确定故障,按照原计划进行修理。打开电源开关,这时候硬盘开始加电,但是由于磁头的缘故盘片并不转。按照逆时针方向用手盘片的最外侧(因为盘片的最外缘是不记录信息的,注意决不要去动盘片外缘2mm以内的任何部分。),稍微用点力气。如果是迈拓IDE硬盘请顺时针扳,因为他的转动方向本来就和其他硬盘不一样。等盘片稳定转起来以后,磁头会自动进行初始化过程,最终停在盘片的外侧。对于部分IBM、HITACHI和一些笔记本硬盘的启停区在盘片之外的硬盘,处理方法有些不同,这些硬盘不需要接电源,用手推磁头臂的线圈,把磁头强行推回外侧启停区。
关闭电源,磁头会回到启停区。这时候用哥俩好粘胶(切记不要用502之类挥发性强的胶),抹一小点在无关紧要的地方。合上上盖,拧好螺丝。打开电源,让硬盘空转半个小时。这是的硬盘通常会有坏道,不管是故障产生时磁头擦伤盘片产生的还是我们维修时磁头擦伤盘片产生的。如何修理和屏蔽这些坏道,介绍坏道维修时我们会再详述。至少现在我们已经可以松一口气,先把宝贵的数据备份出来了。
电路损坏
一些情况下,硬盘的电路板也是很容易损坏的。
有些时候可能是电路板的划伤。对于这种情况,找到损伤的线路,用合适粗细的漆包线做飞线。测试正常后用环氧树脂将修复的部分永久地固定起来。这种方法对于主板、显卡等其他板卡的维修也是十分受用的。
当然更多的情况可能是芯片或者外部元件的损坏。对于一些硬盘的大功率大电流的驱动芯片(主轴锭子电机和寻道音圈电机的驱动芯片),经常会发生过热现象。长时间的芯片过热(超过150摄氏度)。会对芯片产生不可逆转的损坏,芯片的电器性能将逐渐受损。最典型的应该算是昆腾硬盘的AN8428芯片,它的损坏会造成硬盘无正确定位伺服。富士通的某些硬盘也会因为芯片过热使得硬盘不断重启动。对于这种情况,专业的硬盘修理人员通常会更换有问题的芯片,或者直接更换电路板。对于我们来说,既没有顺手的热风枪等工具,也没有用于更换的芯片。不过只要是问题还不算严重,还可以使用加强散热的方法。对于过热的芯片加装散热片,并将硬盘安装在机箱内通风更佳的位置上,比如电源的近气孔附近。虽然只是权宜之计,但是通常都会有立竿见影的效果。需要注意的是市面上有一些专门出售废旧PCB或者芯片的商贩。在他们那里买到的PCB和芯片大部分都并非新品,所以选购的时候要留心一点。买
来的PCB和芯片也许并不比我们手里等待更换的要好。
固件错误
硬盘的固件问题是近一段时间才被揭示出来的,在此之前国内很少有人谈论硬盘的电路构造和控制逻辑。即便有所提及也是极小部分高级维修人员的内部讨论。IBM、希捷、富士通都曾发布过硬盘固件更新程序。目前能对固件进行维修的少数几种软件工具都是俄罗斯的几个私人实验室对各硬盘厂家的内部协议的破解,大部分是通过ATA指令集的保留指令。希捷、三星等硬盘则是通过保留跳线对硬盘CPU进行串行通讯。这些工具还可以通过更改固件的一些数据,进行诸如关闭磁头、内部低格之类的操作。更新固件时有些硬盘需要用特殊的跳线组合进入工厂模式,再配合指令更新固件。 关于固件,没有什么太多要说的东西,因为普通用户实在没有必要掌握太多相关的知识和技巧。只需要知道一些硬盘常见的通病,大概了解相关问题所在,请拥有专业维修工具和软件的专业维修人员代劳就可以了。
常见的固件问题有:在排除其他故障前提下:BIOS不认硬盘、认硬盘但型号不对或者是乱码、开机信息的硬盘容量为零或不正确(容量错误也可能是硬盘跳线错误、硬盘被加密或lba被屏蔽。对于屏蔽的扇区可以用MHDD解除。)
列举一些典型的固件问题,对于这些特定型号的硬盘出现下述故障可以确认是固件故障:
迈拓美钻型号认错
迈拓美钻硬盘启动后转一下就停止
西部数据全盘坏道
富士通硬盘不认
固件错误的硬盘不是很多,可能专业的维修人员见得比较多吧。固件故障一般也就占到维修总数的一成左右,相对来说比较罕见一些。维修的成功率也很少超过80%,通常都是靠维修人员自己长期摸索维修的方法和技巧。
坏道的修理
坏道的产生分为逻辑坏道和物理坏道。对于这两种坏道的区别,要从硬盘的扇区结构说起。硬盘的每个扇区主要分为扇区编号区和数据区两个部分。扇区编号区记录的是扇区自身的编号以及编号的CRC校验码,每个扇区的编号在整个硬盘都是唯一的,每个扇区的编号各不相同,硬盘出厂后通常不再变更。数据区存储的是动态的数据,也就是我们平时写入和读取的数据。每个扇区的数据区有512字节的数据以及ECC可纠错校验码。(不过这只是逻辑上记录的数据,由于采用格雷码等码型记录,实际长度何记录的数据可能不同。)回到逻辑坏道和物力坏道的区别上。物理坏道是指记录的介质已经无法正常的存储数据并被有效地读出,逻辑坏道则是由于偶然的错误,造成写入数据区的数据有严重错误,造成ECC校验出错。或者错误地改写了扇区编号,造成该扇区丢失。对于数据错误的逻辑坏道,可以用DM之类的专用低级格式化程序清零,重写数据及校验区。使数据和校验不再矛盾。对于扇区编号错误也可以用相关工具进行处理。
对于物理坏道,目前有两种方法:修理和屏蔽。修理的方法通常是对有问题的介质反复写入0、1信号,藉以重新激活老化的介质。用到这种方法的软件有HDDreg和效率源。不过这种方法并不是对所有的坏扇区都有效,而且扇区修复以后也可能依然不稳定容易再次损坏,所以最根本的方法还是屏蔽。所以包括上面两种软件在内几乎所有的软件都利用硬盘的缺陷列表隐藏屏蔽坏的扇区。在增长列表g-list中记录有问题的扇区位置,并用保留的扇区进行替换。这个过程完全是硬盘的内部机制,用户和操作系统都会认为没有坏道存在。不过g-list的容量有限,坏道过多就没办法全部屏蔽。这时候专业维修员会利用特殊工具将坏道位置加入永久缺陷列表p-list并进行内部低格。
目前可以对硬盘进行g-list处理的工具除了刚才说过的HDDreg、效率源以外,还有MHDD、THDD、HDDspeed以及各硬盘厂家官方的低级格式化工具。这些工具除了HDDreg、HDDspeed,决大多数不需要BIOS的支持。也就是说即使BIOS中没有检测到硬盘或者在不得已将硬盘屏蔽也可以使用。这些工具的下载和比较详细的使用方法在论坛置顶的〈硬盘工具不定期更新索引〉和其他的精华帖子中可以找到。