上海蓝色帛缔智能工程有限公司 上海 200126
摘要:本文通过对影响数据中心建设规模的各方面进行分析,明确了数据中心建设规模测算的关键因素,给出了预测数据中心建设规模的方法,辅助数据中心规划设计。
1.术语及名词解释
●数据中心是保障并满足IT设备安全、可靠、持续运行的建筑体及环境,可以是建筑群、一栋楼、一个房间或集装箱。
●TPC(Transaction Processing Performance Council)是总部在美国的,非盈利事务处理性能委员。
●TPCC=TPC-C,为业务处理系统。
●TPMC(transactions per minute,tpm,Council)系统处理新订单个数/每分钟内。
2.前言
全球信息技术的发展和应用,成为各行各业最重要竞争手段之一,它能显著提高工作效率和服务质量,继而利用信息技术为人类社会创造更美好的生活。
数据中心是各行各业信息化的重要基础设施,是各行各业必不可少的业务支撑平台,是行业现代核心竞争力的重要表征。21世纪以来,我国数据中心建设进入快速发展阶段,各行各业都在新建、扩建数据中心,众多的IDC也应运而生。但数据中心建设是一项投资巨大、周期长、且很复杂的系统工程,所以新建数据中心需要全面考量和论证,避免投资失误。每个投资方都要考虑数据中心建成后服务什么对象和用户?容纳多少机柜、网络、服务器、存储?5年,10年甚至更长时间后数据中心容量需求是多少?然后才是定义建设等级等问题,因此数据中心中心建设规模是每个投资方的首要问题。本文就影响建数据中心规模的因素进行分析、并对已将要扩建、新建数据中心的各行各业,给出数据中心容量预测的解决方案,让投资方可以有方法、方向设定数据中心建设规模,合理建设,优化投资,获得最高投资回报。
3.数据中心建设的规模分析
.png)
影响数据中心建设规模的因数,除了资金限制、政治因素、场地限制等非技术因素外,它的核心问题是以下7个维度的内部影响因素和外部影响因素。
业务发展对数据中心规模的影响
业务增长要求支持业务运行的IT信息系统保持与之匹配的支撑能力增长,最直接的反馈是业务处理速度、并发处理了量、信息的查询分析等等,则要求提供足够的服务器、网络、存储等来支持业务发展需要,传递至数据中心基础设施层面,就是机柜容量,建筑面积,电力要求;因此数据中心规模增长的最根本原因是业务稳定持续的增长,这说明最直接的导致数据中心规模变化的因素是由业务需求传导至IT硬件设备数量的变化。我们把业务发展的IT数量定义为R1。
IT技术变化对数据中心建设规模的影响
IT技术的发展,是影响数据中心变化的一个重要因数,比如服务器处理能力,高密度刀片服务器的应用,大容量存储器的发展,去IOE到X86虚拟化云计算的普片应用,设备的更新换代,引起了数据中心建设规模的变化。
新技术在业务发展的应用,比如企业业务发展对无人机的应用,大数据分析,VR技术,物联网的普及等的应用需要也很大层面改变数据中心建设规模的需要。我们把IT技术更新值定义为R2,如果没有革命性的技术变革,使用单位没有特别的技术路线颠覆性改变,R2取值通常考虑5-20%。
数据中心现状改变对数据中心建设规模的影响
不论什么单位,各个部门对业务发展预期都不均衡,对机房机柜空间、布局方式、机柜密度、机柜容量、机房环境和空气质量、基础设施可循环使用、综合布线系统规范性和高灵活性、连续性以及网络带宽等方面都会提出一系列差异性要求,这些要求也会传递和影响到数据中心建设规模的容量计算。
数据中心在容量供给制约的因素,往往是资源的不足(空间、电力、制冷量、网络带宽等)、早期设计不合理(局部热点,网络布线不合理等等),安全级别低(供配电、制冷无冗余),环境条件差(安防布置受限、噪音扰民、洪灾影响等),改造升级困难,无法扩容,无法满足可靠性、可用性指标等。我们把数据中心现状改变会考虑在数据中心规划设计中进行综合评价,基本可以规避调这些建设要求,因此,不在另行考虑调整系数。
数据中心全生命周期对数据中心建设规模的影响
数据中心作为专业化的耐用建筑,根据国内外的经验数据,通常把30年运营时间,作为数据中心全生命周期指标。
在其全生命周期中,IT系统的变革特别是新技术的发展,产品老化,促使数据中心关键基础设施更新换代。关键基础设施的经济寿命大约为10年左右,在正常运行6-8年后就需要开始启动下一轮深度改造来满足业务及IT系统发展需求。在整个数据中心生命周期内需要实现三轮深度改造更新。
因而,数据中心的配置和空间需要满足滚动改造更新,而不影响安全生产,所以在空间及模块设计上需要有余量。但对于有容错设计的数据中心,其升级改造影响非常低,所以不考虑需求变化。
行业监管对数据中心建设规模的影响
各行各业的规范化发展时代来临,对IT及信息化的规范性、高效性、安全性及用户隐私等,提出更多的要求,信息技术处理的数据量加大。长远来看行业监管将越来越严苛,也会导致管理及使用数据中心的单位来适应行业要求,提高了对IT实时性、安全性门槛,这也会增加数据中心基础设施的安全要求及合规性要求等,间接改变了数据中心的规模增长和等级提升。但是,按照现在IT技术的发展,其IT处理能力也越来越强大,因此,若无特别大的政策变化,其行业监管对数据中心容量影响可暂不考虑。
业务连续性要求对数据中心建设规模的影响
业务应用系统连续性指标是是数据中心分级建设的最重要要求,业务连续性保障越高,建设等级就越高,国际标准是Tier I-IV共4级,国家标准是A、B、C级。级别越高,容错要求也越高,数据中心的基础配置及IT配置冗余占比就越大,容量增加,规模变大。但数据中心规划设计的关键点就是业务连续性,因此在IT配置、规划设计时已经考虑了相关需要,不在重复计算冗余量影响。
同行业数据中心对比对数据中心建设规模的影响
同业对比,是通常规划设计都采用的主观评价方式,通过考察、了解、分析同业规模、业务发展情况、主要是IT规模,比对自身建设的需要,来参照评估数据中心建设规模。从另一个侧面评数据中心建设规模的需要。我们把同行业数据中心对比更新调整值定义为Q(定性主管评价)。
数据中心建设的规模分析结论
综合上述,影响数据中心建设规模的因数主要是:业务发展需要R1、IT技术的更新R2、数据中心的现状改变、数据中心生命周期,行业监管、业务连续性,同业对比Q等7个方面。他们的加权组合是形成数据中心建设规模评估的关键指标。
通过合理的规模评估来筹建数据中心既可以解决规模增长带来的瓶颈,满足业务长期发展的要求,又可以避免盲目投资和规划不足的风险和损失。
4.数据中心建设规模的预测
基于前面的分析,我们知道影,响数据中心建设规模的因数主要是:业务发展需要、IT技术的更新、数据中心的现状改变、行业监管、业务连续性,同业对比等7个方面。其中数据中心规模增长的最根本原因是业务稳定持续的增长,这说明我们首先考虑最直接的导致数据中心规模变化的因素是由业务需求传导至IT硬件设备数量的变化,然后在加权其他因素就能够预测数据中心发展规模。因此,可以通过分析历史数据、业务需求、IT发展趋势等因素估算IT硬件设备数量,进而估算出IT系统对电力和空间的需求,最后预算出数据中心规模大小。其估算方法参见下图:
数据中心建设规模预测模型
.png)
IT规模预估的方法主要有定量和定性两个方面,可分别利用数学模型演算和利用实际经验推测。本项目采用了在定量分析的基础之上,使用定性分析,对结果进行修正的方式。
根据上述推算方法,预测出未来5-10年数据中心规模(面积和电力)。
4.1服务器规模估算
4.1.1计算方式一:
TPCC是一个典型应用环境下服务器计算能力的综合评测值,能较准确地反应企业对服务器计算资源的需求,并消除因服务器类型不同而造成的差异。利用TPCC值作衡量服务器计算能力的标准。其估算思路如下:
利用历史的业务量指标(交易次数)可以计算出原服务器群的平均TPCC值,通过选用主用服务器处理能力可以推导出服务器数量;
由资产总额与服务器数量值趋势分析得到拟合度最高的数学模型,如:呈多项式上升的数学模型;由数学模型反算历史数据接近值是否吻合,验证数学模型是否匹配。如果匹配,就利用数学模型和未来资产总额的业务目标,推算未来服务器TPCC值的需求。
在估算出未来所需要的服务器的TPCC值以后,根据选定基准服务器机型和服务器比例,计算出不同类型服务器数量。最后根据服务器安装规则,计算出服务器所需的机柜数量和总额定功率。
考虑资产总额这个业务指标之外,还需要考虑一些影响因素,这些因素包括CPU利用率、安全冗余系数、可用性(HA)指标和集群等,在本次估算中,基于收集数据和简化建模,仅考虑总资产、CPU利用率2个影响因素。
在定量分析的基础上,引入定性分析对定量结果进行修正,这些因素包括虚拟化比例、服务器处理能力的提升、设备上架原则及冗余等。
根据XX单位案例:5年历史数据
.png)
现状分析得出,A服务器占比约在50%左右,B服务器占比约在49%左右,其他服务器占比约在1%左右,整个平台X86服务器占比99%。假定参考主流A服务器,其TPS=25000;B服务器,其TPS=20000;为计算方便,省略计算C服务器。平均TPS=25000*50% +20000*49%=22300,TPMC=22300*60=1,338,000来计算。
参照A、B、C服务器硬件厂商服务器更新周期和设备更新周期,界定每5年单台服务器处理能力提升约2倍的因素,但服务器冗余系数不低于20%,因此该因素可以对冲不计。
取服务器利用率等因素,调整增加30%的浮动变化率。同时因为每个交易数据采集要求增加、相应处理量增加,2014年至2019年每个交易计算次数60、60、80、90、100次。峰值系数取8。
年服务器总量={交易次数/8(工作时间小时)/60(分钟)/0.7(可用性系数)}x8(峰值系数)x每个交易计算次数,我们可以取得2014年-2019年服务器计算值:
5年历史数据TPCC计算值
.png)
依据上表,我们可以取得资产总额与服务器的对应关系,从而推导未来趋势,采用资产总额的原因是因为各行各业会预计发展规模,评价和预期未来资产量,有目标可寻。通过分析利用2014至2019年度的总资产和服务器数量值绘制散点图,进行趋势分析,得到拟合度最高的数学模型 y =(0.0059X2+22.896X-3376.5),该模型用于预估未来5-10年服务器的规模。见下图:
.png)
2014年-2019年TPCC计算服务器与总资产散点关系图
用总资产的线性增长率来预测2020和2029年资产总额规模预期值,详见下表:
.png)
利用数学模型和2020年及2029年的资产总额预期值,通过上述数学模型公式推算出2020年和2029年的服务器服务器总量,未考虑到未来可能实施的重大业务举措的可能,应对未来可能发生的业务激增等突发性变化的未知因素另行评估。
2020年-2029年服务器增长预测值
.png)
根据预预测2020年到2029年服务器数量。2024年服务器总量= 14467台(A服务器=14467x50%=7234台,B服务器=14467x49%=7089台),如果每个机柜15台,约需要964个机柜。2029年服务器总量=18740台,每个机柜15台,约1249个机柜。(机柜预测未包含存储及网络)
4.1.2计算方式二:
依据2014年至2019年5年的服务器实际使用数量寻找匹配的趋势公式,根据每年的服务器数量值绘制柱状图,进行趋势分析,得到拟合度最高的数学模型Y=876.15X1.1331,依据数学模型推导2020-2029年服务器数量,2024年需要服务器11875台(每个机柜15台服务器计算,共需792个机柜),2029年需要服务器18785台(每个机柜15台服务器计算,共需1252个机柜)。(机柜预测未包含存储及网络)
服务器增长趋势预测
.png)
折算的10年服务器增长趋势对应的机柜数量(每个机柜15台服务器计算)
.png)
4.1.3计算方式三:
依据2014年-2019年5年的机柜实际使用数量与资产总额之间绘制散点图,寻找匹配的趋势公式,进行趋势分析,得到拟合度最高的数学模型Y=508.14ln(X)-2582.1,依据公式推导2020年-2029年服务器机柜个数,(机柜预测已经包含存储及网络)。2024年机柜需求967个,2029年机柜需求1297个。
2014年-2019年机柜与总资产散点关系图
.png)
2020年-2029年机柜增长预测值
.png)
通过3个方式分析,印证分析结果,及服务器机柜的基本需要。
机柜规模预测
.png)
(注:方式一、方式二还没有考虑存储及网络设备数量占用)
4.2存储设备规模估算
目前存储主要是三种常见架构:DAS(直接附属存储)、NAS((专用数据存储服务器)、SAN(即存储区域网络,是光纤连接存储设备的高速专网)。目前数据中心主要是NAS和SAN 2种存储架构。
存储设备相比服务器设备数量少,在数据中心内的部署数量、占用空间和所需电量占比较小,按照环比趋势的预测,直接考虑未来数据中心所需存储的裸容量、来估算标准取存储的容量。
利用存储裸容量的历史数据,分析目前的存储总量是多少,占用空间多少U,多少机柜(取满配数值)。采用环比趋势分析的方法,估算未来业务系统对存储容量的需求,再由存储容量计算出需要的存储设备的数量和占用空间,推算未来5到10年存储裸容量的需求。
分析目前存储设备主要的品牌型号,确认机房存储总容量占用的机柜数量。
通常存储设备约占数据中心机房10-15%机柜空间。
根据信息技术发展状况及历史数据分析,存储爆发性增长已经过去,因此存储增平均每年会依据IT发展来增长。
未来的精细化管理及很多的合规性要求增加存储,将影响存储更加庞大,但考虑后期存储器容量的加大及存储数量增长的稳定发展,新数据中心中的存储需求,可以按照服务器增长的10-15%来考虑(注:业界数据中心机柜数占比中,存储通常占比10-15%)。存储设备规模调整系数我们定义为C。
4.3网络设备规模估算
网络设备数量的预估,按照与服务器存储关联程度划分为两大类,一类为与服务器存储直接相连的设备,接入交换机,采用定量分析为主的计算方法。另一类位其他网络设备(汇聚交换机及核心交换机),主要与网络结构关系密切,采用定性分析为主的计算方法。
接入交换设备可以采用以下公式计算并推导网络设备的数量:
接入交换机计算数学模型如下:W=(M/P)N/24(W:交换机总数(按24口考虑);M:网卡总数;P:端口利用率;N:服务器基准机型端口数)。
假定网卡配置1000个,利用率80%,端口数4,W=(1000/0.8)×4/24=208.33,约208台接入交换机。然后通过网络架构考虑汇聚交换机、核心交换机、防火墙等数量,来评价网络设备规模。
网络配线架的增长数量,依据网络设备增长数量的端口数的2倍来计算。
数据中心发展趋势基本是X86平台服务器为主,因此我们也可以考虑网络设备数量增长与服务器增长可以同步预计,我们也可按照通常惯例取服务器增长量的10-15%作为快速评估网络增长量的方法。网络及配线架增长系数定义为W。
4.4小型机设备规模估算
IT技术的发展趋势基本是X86平台服务器为主主导,去IOE已经多年,因此小型机系统的评估主要考虑业务的延续需要,如果没有特别的业务需求,它可能没有设备数量增长,因此,我们定性分析的方法来评估其变化量。小型机设备增长量定义为E(往往一台小型机最少占用一个机柜空间)。
4.5未来10年IT规模估算
假定未来10年被预测单位业务的发展趋于稳定,没有大的变化预期,业务发展有序平稳进行。我们可依据统计分析上述的数据,得出数据中心未来的总体规模。
数据中心IT总规模容量=R1(1+R2 +C+W)+E+Q。
{业务发展需要R1、IT技术的更新R2(5%-20%)、同业对比Q、存储增长率C(10%-15%)、网络设施增长率W(10-15%、小型机数量E}。
在本案例里,数据中心IT总规模容量=R1(1+5%+10%+10%)+0+0= R1x1.25。折算到机柜数量如下表:数据中心IT总容量= =R1x1.25。
对机柜增长的预期调整,仅仅考虑新技术变化一项。
3种方式数据中心规模预测调整值
.png)
因此,数据中心的总规模=(方式一+方式二+方式三)/3=(1562+1565+1362)/2=1496.33,预留10%的向上浮动调整量来满足变化的需要,最终机柜总数为1646。
预测2020年-2039年数据中心最终机柜数
.png)
基于上述分析,认为10年后主数据中心规模选取1646个机柜的规模规划较为合理。
4.6主数据中心IT规模估算结果
根据2020年至2029年资产规模预测,利用总资产和TPCC的数学模型、机柜增长分析及服务器增长分析,预测数据中心未来10年的服务器数量及机柜规模。每个机柜按照装机15台服务器计算。而且完全采用X86服务器架构考虑,所以机房规模简单化计算如下:
数据中心机房机柜及服务器容量估算表
.png)
根据2020年至2029年预测机柜数量,每个机柜15台服务器装机容量、约4500W,可预留配电容量为每个机柜5KW(密度问题需要根据行业要求及建筑条件决定);同时参考通常理想数据中心建设占地面积预测所需建筑面积(12平方米/每机柜,包含主机房及辅助设施区,不含ECC、办公区、园区);从而得到2020年至2029年IT设备所需总功率和数据中心建筑面积值。
2020至2029年主数据中心机柜、面积及用电量估算表:
.png)
根据该表,就可基本确定未来数据中心10年的规模需要,需要建设一个约2万平方米的数据中心,单边用电容量不低于11522kw。由此,可以进行选址,建筑规划等后期工作了。
对于投资IDC这样的数据中心。没有历史数据怎么评估建设规模?IDC主要是目标定性、客户导向、服务分析。IDC投资通常是依据场地可用性,以建容量多少机柜的数据中心?客户群体是什么?然后能源评估通过后,按确定的机柜目标及服务等级的去投资建设,往往是定了机柜目标和建设标准,反推建设分期和投资分配,这个模式也可以用于没有历史数据的数据中心建设。
5.结论
通过对影响数据中心建设规模的直接因素的分析,我们可以全面了解数据中心规划时的多方面需要,同时借助各单位发展的历史数据,可以有有效的方法推导数据中心IT数量的未来需求,并转化为数据中心机柜容量,从而推导数据中心模块用电量,面积,帮助投资方合理的实现数据中心建设,获得最佳经济及社会价值。
参考文献:
[1]《数据中心设计规范》(GB 50174-2017)
[2]《智慧云数据中心》电子工业出版社
[3]TPC事务处理性能委员会http://www.tpc.org