气象信息存储对磁盘阵列技术的需求分析

发表时间:2021/5/6   来源:《中国科技信息》2021年6月   作者:陈九忠 田晓明
[导读] 介绍磁盘阵列技术,分析蚌埠市气象局对磁盘阵列的需求,提出市气象局选用磁盘阵列时应考虑的因素。

安徽省蚌埠市气象局    陈九忠 田晓明

摘要:介绍磁盘阵列技术,分析蚌埠市气象局对磁盘阵列的需求,提出市气象局选用磁盘阵列时应考虑的因素。
关键词:磁盘阵列技术  信息存储  
        1引言
        随着互联网和计算机技术的发展,气象信息时次加密,气象信息的数据量不断增加。另外,气象业务的拓展,如人工影响及各类专业气象服务信息的数据也在快速增加。无论是虚拟资源还是日常的业务数据,其规模增速较大。如何存储海量的业务数据和虚拟资源,保证气象数据具有安全性、容灾性、响应的时效性,是气象网络化建设必须考虑和解决的问题。使用磁盘阵列技术是有效利用和管理这些数据并保证气象服务质量的重要途径。
        2.磁盘阵列技术概述
        磁盘阵列技术内容是:采用并行原理,将多个物理磁盘组合成逻辑盘阵列,通过并发读/写操作,提高数据传输速率;采用编码容错方案,提供数据的高可靠性。其特点是海量存储、高效存取、数据安全性高。磁盘阵列所使用的技术基础是 RAID技术,RAID是Redundant Array of Inexpensive Disks的缩写,意为廉价冗余磁盘阵列。目前广泛应用的 RAID技术有 RAID-0、RAID-1、RAID-0+1和 RAID-5。
        (1)RAID-0具有成本低、读写性能极高、存储空间利用率高等特点。缺点是没有数据冗余的功能,其数据安全性甚至比单个磁盘还低,一旦系统中某个磁盘失效,整个阵列中的数据将全部丢失,所以,RAID-0中配置的盘不宜太多。
        (2)RAID-1的两块硬盘数据完全镜像,具有安全性高、技术简单、管理方便、读写性能良好等特点。当其中一个磁盘失效时,系统可以从另一个磁盘操作数据,提供了100%的数据冗余功能。但它无法扩展单块硬盘容量,数据空间浪费大。
        (3)RAID-0+1综合了 RAID-0和 RAID-1的特点,独立磁盘配置成RAID-0,两套完整的 RAID-0 互相镜像。它的读写性能出色、安全性高,但构建此类阵列的成本投入大,数据空间利用率低,不是经济高效的方案。
        (4)RAID-5是目前应用最广泛的 RAID技术。各块硬盘进行条带化分割,相同的条带区进行奇偶校验,校验数据平均分布在每块硬盘上。RAID-5具有数据安全、读写性能高、存储空间利用率高等特点,是一套将高性能、低价格和数据安全性综合在一起的解决方案,也符合气象信息对数据存储设备所要求的技术条件。
        3市气象局对磁盘阵列的需求
        市气象局信息化建设是以实现气象业务的集成化管理,建立性能可靠的气象存储服务器,实现气象分类存储。在气象信息化建设中,各种不同性质服务器任务分配妥当后,存储所有数据的磁盘阵列便提到日程上来。在气象存储方案规划前,先要从气象信息的存储需求分析开始,而需求分析要从磁盘阵列的三大特色来进行。
        3.1容量需求分析
        气象业务的发展,使气象信息快速增加,所以解决服务器的容量问题是必须首先考虑的。而各种信息资源的存储是使用磁盘阵列容量最大的应用,这些资源包括各种气象观测数据、气象预报产品和气象服务产品。其中雷达基数据和雷达产品每天大概有 10G,每年4T,保存25年,共需200T。
        在设计海量存储方案时,目前单一硬盘的最大容量为8T B,配制是以 12个硬盘为一组 RAID-5,RAID 5后可用容量约为 76.8TB,可以划分为 2到 3个分区,每个区的容量约在 600GB-800GB左右。如果容量需求是 3T,则建议使用 24块146GB硬盘,以 12块硬盘为一组 RAID-5(一个容错盘,一个热备盘),以每个分区为 500GB,可以分配给不同的图书、期刊、和音频视频资源在不同的服务器分别使用,以达到服务器共享资源的功能。在配置 3TB时,不用 24个 146GB为一组 RAID-5而以2组 12个 146GB为一组 RAID-5,主要有三个因素,第一是盘阵和系统均有 2TB 的限制,第二是性能会变慢,第三是不易维护,以免当其一硬盘故障后数据重建时间太长。这些都说明在考虑容量设计时,还要考虑磁盘阵列的性能和可维护性。


而在使用大存储空间时,建议使用多个 500GB-600GB容量分区,而不用 2TB的大分区,主要是出于为了提高服务器的读取性能,和容易分配给多台服务器,以简易服务器管理共享盘阵数据的考虑。
        3.2读取性能分析
        在考虑读取性能时,要了解气象数据的成份。因为现代图书馆拥有气象数据和频视频资源,两者的数据类别和读取方式有很大的差别。数据文件是以百万、千万计小数据块(约 15KB-30KB)的随机读取,而 VOD应用中的音频视频资源是大数据块(约 50MB-100MB)的顺序读取。所以在同一个磁盘阵列中同时要满足这两种读取方式,除使用光纤盘阵 2Gbit或 SCSIUltra160的带宽,磁盘阵列上的缓存最好配置 512MB、设置不同的RAID-5的条块大小的磁盘阵列硬件指标,还要在 RAID-5的配置上,不要超过 12个硬盘,并使用 RAID-50以提高磁盘阵列的性能。对于硬盘转速的要求,则使用每秒1万转的硬盘即可满足。在大容量共享磁盘阵列的设置上,不同分区方式对于主机的读取性能表现亦不同。盘阵上多个软分区,也会提高主机对于大数据量的 I/O吞吐能力,以发挥高速磁盘阵列的最大的读取性能。
        3.3安全性需求分析
        气象信息化建设除了要求技术上的先进性,还要保证磁盘阵列稳定、安全的运行。因此盘阵应具有数据保护功能,包括冗余电源、冗余风扇、硬盘冗余技术(RAID-5)、磁盘阵列缓存电池等。对于更高安全的要求,包括共用的线上热备盘、双机容错和双冗余磁盘阵列控制器则可依经费和预算而定。所有磁盘阵列的投资均以保护所有资源的可用性为目的。
        4市气象局选用磁盘阵列时应考虑的因素 
        除了考虑磁盘阵列的容量、性能和安全性外,还有另外三点要素也应考虑:
        4.1多台服务器共享磁盘阵列的连接性
        因为所有的信息资源必须由多台主机共享,所以盘阵必须和各种不同主机连接,可适用于各种不同操作系统,才可能达到这个要求。在规划气象现代化建设方案时,要考虑两个因素:第一是开放性和兼容性,第二是连接方法。就开放性而言,由于在不同的应用中,会有不同的操作系统来管理磁盘阵列,外接磁盘阵列与操作系统相对独立,所以没有驱动程序的问题。同时,只要服务器上有相对应的 SCSI卡或光纤卡和在系统中相对应的 SCSI卡或光纤卡驱动程序,即可连接到主机上使用,所以也没有兼容性的问题。在连接性方面,一般 SCSI磁盘阵列标准为 2个主机通道,可以直连2台主机,光纤磁盘阵列标准为 4个主机通道,可以连接4台主机。当有 5台以上的主机要共享信息资源时,可以考虑使用 SAN结构,只需再加存储光纤交换机便可以扩到 5台以上。
        4.2磁盘阵列的可扩展性
        在气象信息化建设中,磁盘阵列扩容需要从容量,性能、安全和系统的连接数量来考虑。所以在磁盘阵列的采购指标中,除了满足现有的需求外,同时还要考虑到未来的升级能力。目前的光纤磁盘阵列是市场上的主流产品,选择产品时要考虑到预算和最佳的性能价格比。
        4.3磁盘阵列的可维护性
        磁盘阵列的硬件技术已经发展到模块化设计,所有的硬件设备都可以进行热插拔操作,方便安装和维护;除了磁盘阵列硬件模块化的要求外,硬盘品质、使用环境、供货商在当地的服务品质和备件准备情况也都是要考虑的重要因素;为了保证磁盘阵列的稳定使用,由原厂商提供的产品维护和服务证明也是其中一项需要考虑的重要因素。
        5结论
        通常,在气象信息化建设时对于整体系统的建设要求是统一规划,分期实行,并且成为有特色的存储方案。磁盘阵列柜内储存的所有数字化资源,是现代气象信息中最重要的宝藏,也是气象信息建设中重要的一环。选择兼具大容量,高性能,高安全,易维护同时满足现有需求和未来扩容的存储系统,是实现气象数字化的重要标志之一。
参考文献
[1]王皓,张伟.如何选择磁盘阵列[J].计算机世界,2000
[2]罗梅,程波.磁盘阵列多级恢复系统的设计与实现[J].计算机工程,2011
[3]贺秦禄,李战怀,王乐晓,等.磁盘存储测试技术研究[J].计算机科学,2012
作者简介:陈九忠(1973-),男,汉,安徽省怀远县人,硕士,工程师,研究方向气象学及信息管理。

 

投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: