广州地铁集团有限公司运营四中心 广东省广州市 510000
摘要:本文简要介绍当前广州地铁十四号及知识城线视频监控系统,主要讨论十四及知识城线线路目前所用视频存储方式。通过RAID阵列介绍,对比十四号线及知识城线存储RAID方式,针对分析阵列方式对存储影响,以及介绍N+1配置对于存储的优化。
关键词:视频监控;存储;阵列;N+1
一、研究背景
地铁专用通信视频监视子系统是地铁运营管理现代化的配套设备,供控制指挥中心调度管理人员、车站值班员、站台工作人员及司机实时监视车站客流、列车出入站及旅客上下车等情况,以提高运行组织管理效率,保证列车安全、正点地运送旅客。根据2015年12月27日第十二届全国人民代表大会常务委员会第十八次会议通过《反恐怖主义法》(下称《反恐法》),该法规自2016年1月1日起施行。《反恐法》第三十二条明确规定:“重点目标的管理单位应当建立公共安全视频图像信息系统值班监看、信息保存使用、运行维护等管理制度,保障相关系统正常运行。采集的视频图像信息保存期限不得少于九十日。” 其中包含了政府机构、银行、城市大型活动场所、机场、火车站、城市轨道交通站等重点目标,其视频录像由30天以上须调整为90天以上。视频监控存储系统重要性可见一斑。
二、存储系统功能实现
存储设备的形态从早期的DVR发展到NVR、集中式IP SAN存储进而至云存储趋势。广州地铁知识城线和十四号线存储均采用分布式的IP-SAN存储方式,在各个车站、控制中心分别设置1套视频存储设备用于对车站内所有专用视频监视系统摄像机摄取的视频信号进行实时不间断录像。存储区域网络(SAN):存储设备与计算单元通过专用的网络互联,与通用网络相互独立,适用于大数据量、多用户、高可靠性、高带宽需求的存储应用场景。IP-SAN即借助以太网通过TCP协议组成专用存储子网供以SAN模式访问、对外提供服务。
图1 视频存储及调看流图
提供的存储容量、IO性能满足全部视频存储90天(按24个小时/天,图像分辨率为:高清1920×1080P,码流8M,)及支持不低于10个客户端同时访问的能力并配置相应容量的企业级硬盘。
三、RAID介绍及对比
因为车站存储系统需要24小时不间断读写,又需要处理车站、监管部门等不同用户对存储资源使用请求,同时保证这两点不受影响且系统需要更加稳定,需要存储系统增加冗余机制。RAID(Redundant Arrays of Independent Disks)冗余磁盘阵列,可通过在多个物理磁盘上同时并行读写以实行磁盘性能提升,同时增加冗余磁盘阵列。常见的RAID磁盘阵列有RAID0、RAID1、RAID3、RAID5和RAID6等。其中:
RAID0:最早出现的RAID模式,RAID 0最简单的实现方式就是把N块同样的硬盘用硬件的形式通过智能磁盘控制器或用操作系统中的磁盘驱动程序以软件的方式串联在一起创建一个大的卷集,没有提供冗余机制。
RAID1:磁盘镜像,即数据在写入一块磁盘的同时会在另一块闲置的磁盘上生成镜像文件,这样系统中任何一对镜像盘相当于备份冗余,增强了系统可靠性。但是磁盘的利用率下降了50%。
RAID 3:带奇偶校验码的并行传送。RAID 3是n块盘,其中1块盘作为校验盘,剩余n-1块盘相当于作RAID 0同时读写,当其中一块盘坏掉时,通过奇偶校验,可以还原出坏掉盘的原始数据。最多允许坏一块盘。
RAID 5:分布式奇偶校验的独立磁盘结构。在RAID 3的基础上有所区别,同样是相当于是1块盘的大小作为校验盘,n-1块盘的大小作为数据盘,但校验码分布在各个磁盘中,即分布式校验盘。最多坏一块盘。
RAID 6:RAID6是带两种分布存储的奇偶校验码独立磁盘结构。在RAID 5的基础上,又增加了一种校验码,也就是最多坏两块盘,提高了系统可靠性,但对于系统性能要求更高,实施复杂性也大大提升。
四、现有阵列配置
知识城线和十四号线所用的存储设备同时支持RAID5\RAID6,知识城线采用RAID5阵列配置,数据读写效率更高的同时可支持一块硬盘热备。十四号线在满足自身存储90天的容量要求下实行RAID6阵列,可同时支持两块热备盘。
以单站存储系统为例,将所有磁盘初始化后创建磁盘阵列,选择阵列类型为RAID6.进行奇偶分盘。由以上对比可知,此类优化后十四号线RAID6阵列相较于知识城线RAID5可支持多一块硬盘故障,系统稳定性更强。
图2 阵列创建方式
五、存储容灾配置
十四及知识城线采用N+1存储容灾配置,具备车站存储设备的后备功能。
N+1备机冗余功能保证工作机故障时,录像业务不中断,数据不丢失,提供设备级保护,提升系统可靠性。具体工作原理:指定1台存储阵列作为监控主机,对网域内其他存储阵列(工作主机)启动监控功能,当发现被监控的工作主机出现异常成为故障主机时,此台监控主机主动接管故障主机的工作,可以实现取流,存储,下载,回放等功能,同时继续监控故障主机,当发现故障主机恢复正常成为工作主机时,则停止所有的接管工作,并将接管期间的录像数据回迁到工作主机中。
图3 N+1存储拓扑
目前线路采用N+1识别逻辑:全线摄像机统一使用了流ID做为存储N+1功能的标识符,每当站里的存储出现故障时,存储主机及备机能正确识别需要回传的对应的摄像机录像。
此种处理逻辑存在问题:当有各站存储增量摄像机加入时,需在存储主机及备机都加上对应流ID作为识别,较为繁琐,且存在人为遗漏的问题。
针对N+1功能存在问题,考虑进一步进行优化配置。通过改变线程的工作机制,使存储自适应识别主机与备机的编码器信息(即摄像机编号),不再使用流ID,在各站存储主机录入摄像机信息后,存储备机通过与存储主机的心跳自动更新自身的数据库,减轻维护量,更加智能化。
同时根据前期经验,为避免N+1回迁进程累加从而内存占用过大导致服务异常退出,在部署过程中应注意适配监控并回收内存,同时对N+1搜寻进程进一步简化。
六、结语与展望
视频存储作为查询、查证、溯源的重要手段,在地铁运营中具有重要安全意义。在日益发展的摄像机智能分析等功能要求下,视频存储结构也需要与时俱进,云存储技术应运而生。广州地铁将一以贯之把握先进技术,为轨道交通行业提升贡献力量。
七、参考文献:
1、http://security.asmag.com.cn/tech/201702/75925.html
2、[1]罗象宏.磁盘阵列的编码与容错技术研究[D].清华大学,2014.
3、https://www.zhihu.com/question/20131784
4、王圣俊.基于IP-SAN的双冗余存储服务器的设计与实现[D].中国电子科技集团公司电子科学研究院,2018.