磁盘阵列管理维护经验谈

随着企业信息化进程不断的加快,对业务数据的安全性要求也不断提高,磁盘阵列(redundant array of inexpensive,简称raid)作为数据存储的一种主要方式在许多企业中被大量采用。磁盘阵列是一种安全可靠的数据存储备份方式,但是磁盘阵列系统本身也存在着安全性的问题,也需要对其本身进行管理维护。若管理不到位,系统一旦出问题,很难用手工方式恢复,会给企业带来不必要的损失。因此根据不同的业务数据量、不同的数据安全性要求,并结合使用的磁盘阵列产品技术支持情况,制定适合的管理维护措施,可以避免系统出错,保证整个网络系统中数据的安全。下面就简单谈谈在磁盘阵列系统管理维护方面的一点经验。

  及时备份系统配置参数

  建立磁盘阵列系统后,要及时记录磁盘阵列的逻辑配置、物理配置、状态配置等参数,具体包括使用的每个逻辑盘大小、raid类型、条带容量、数据写入磁盘方式、由哪些物理磁盘组成,每个物理磁盘的通道号、目标序列号、生产厂家、型号、容量、阵列控制器的型号、固件(firmware)版本,处于后备待机状态(hot spare)还是在线状态(on line)等。上述配置参数在磁盘阵列或操作系统崩溃后,在紧急重建阵列、恢复存储数据的过程中是必不可少的。一般阵列控制器bios芯片装载了阵列配置软件,管理员以文件形式备份上述参数。

  及时检查运行日志文件

  磁盘阵列的日志文件详细记录了磁盘阵列内部运行情况,包括发生的每个事件序列号、严重级别、相关的服务器ip地址、有关设备的具体位置及事件发生的时间等内容,这些信息对于诊断和排除磁盘阵列故障十分有用。做好日志文件的日常管理工作,往往能起到防患与未然的作用。采用raid数据冗余技术,即使有一个物理磁盘损坏,也不会影响系统正常运行和数据的i/o,用户也仍能够正常访问服务器,这时故障不易被察觉,但阵列实际上已处于安全临界状态,下一步就会面临着突然宕机和存储数据随时丢失的危险,日志文件及时将这一情况记录在册,损坏的磁盘记录为下线(off line),其所在阵列记录为临界状态(critical),通过检查日志就能够及时发现阵列运行中存在的这个错误和隐患,迅速排除故障,保证阵列始终处于安全运行状态。

  定期检查数据一致性

  数据冗余是磁盘阵列主要技术之一,磁盘阵列通过数据冗余达到容错目的,但是由于各种原因,难免会遇到冗余数据与主数据块(primary data)不一致的情况,结果造成数据失效甚至宕机等现象。一致性检查能及时发现和纠正潜在的错误数据,保证阵列中数据的完整性。通过对raid互为镜像的磁盘数据一致性检查,或者主数据块进行重新校验,将产生的校验数据与冗余数据比较,都能发现不一致的错误数据。一致性检查一般间隔时间以每周1~2次为宜。

  建立热备用磁盘

  热备用磁盘也是raid技术的又一项技术,当磁盘阵列中一个正在使用的物理磁盘发生故障后,一个待机的磁盘会立刻上线,代替此故障盘,阵列控制器根据逻辑驱动器上的冗余数据,通过校验算法把原来存储在故障盘上的数据重建到热备用磁盘上。成为热备用磁盘必须有三个条件:一是有不小于故障盘的容量;二是平时不得存储任何数据,也就是闲置不用;三是阵列控制器自动重建数据功能有效。在一个阵列中,只能有一个热备用磁盘。热备用磁盘增加了一次数据逃生的机会,系统管理员要及时更换发生故障的磁盘,并指定新的热备用磁盘。

  定时备份重要数据

  配备了磁盘阵列并不意味着可以高枕无忧了,由于考虑设备投入成本、技术复杂性等因素,不可能同时采用阵列控制器冗余、磁盘冗余、热备用磁盘、备用电池或双ups电源供电等技术,所以,对于重要业务数据一定要备份。在美国“9·11”事件中,正是靠磁带备份和远程容灾系统挽救了金融界巨头摩根斯坦利公司,由此可见数据备份工作的重要性。数据备份的介质可以是磁带、可读写光盘,也可以还是磁盘。备份方式可以是通过操作系统本地备份或通过网络系统远程备份。

  磁盘阵列系统的安全运行是离不开系统、科学的安全管理,尤其在由于经济条件限制的企业中,由于配置的冗余设备很少、技术不完善的情况下,更需要通过加强安全管理,来弥补其硬件安全性方面存在的不足。

  • 磁盘阵列管理维护经验谈已关闭评论
    A+
发布日期:2019年07月02日  所属分类:参考设计