浅谈基于大数据的港口设备投资决策系统

发表时间:2020/6/3   来源:《基层建设》2020年第4期   作者:邢邦宇
[导读] 摘要:港口每天产生海量数据,包括港区内货物流动数据、船舶靠泊数据、设备使用数据、设备能耗数据等。
        营口港融大数据股份有限公司
        摘要:港口每天产生海量数据,包括港区内货物流动数据、船舶靠泊数据、设备使用数据、设备能耗数据等。通过大数据技术处理,这些数据能描绘出企业、货物、物流、行业的潜在特征,从而对决策制定起到辅助作用。
        关键词:大数据;港口;投资
        1基于大数据的港口设备投资决策系统设计背景
        港口行业具有资本密集型、规模经济性和周期性特点:一方面,港口企业产品具有不可存续性,港口只能通过保有一定的吞吐能力来适应吞吐量增长需求;另一方面,港口吞吐量需求具有派生性,一旦经济衰退,贸易量减少,就会出现产能过剩、设备闲置的局面,造成资源浪费。目前,港口设备固定资产投资决策呈现粗放式,存在缺乏综合经济分析、投资决策效率低等问题。信息技术的迅猛发展对数据库技术提出更高要求,主要体现在以下方面:(1)高并发读写需求;(2)海量数据的高效存储和访问需求;(3)高可扩展性和可用性需求。
        2基于大数据的港口设备投资决策系统设计方案
        2.1系统结构
        基于大数据的港口设备投资决策系统业务功能覆盖总体概览、投资额管理、港口设备数据查询、装卸设备数据查询、官方数据查询、决策辅助支持等。2.2系统功能
        如图2所示,基于大数据的港口设备投资决策系统采用模块化功能设计,主要由数据采集模块、设备分类管理模块、数据查询模块和预测决策模块组成。2.2.1数据采集模块
        数据采集模块主要采集设备投资数据、设备相关数据(包括设备台账数据和设备单机运行数据等)和官方统计数据等。数据采集形式分为Excel导入、网络爬取、手工录入等。
        2.2.2设备分类管理模块
        设备分类管理模块的主要功能是在预制设备分类表的基础上完成对设备投资数据的自动分类。通过一定量训练集得到相关的分类标准后,该模块可实现类别增加和删除操作,同时将操作结果同步至数据库以实现自动分类,并且能够执行相应的维护操作。
        2.2.3数据查询模块
        数据查询模块用于查询设备台账数据和设备单机运行数据中部分具有决策参考意义的数据,并能针对重要装卸设备进行运算,实现对设备数据的直观查询。
        2.2.4预测决策模块
        预测决策模块用于分析、预测各类设备投资额,并对预测结果和历史趋势以图表形式进行可视化呈现,同时实现单类数据的提取查询功能。设备固定资产投资是港口企业经营活动的重要内容之一,是涉及港口企业生产经营全局、影响港口企业生产经营方向和结构的战略性投资活动。然而,港口行业发展具有周期性,受世界经济和国际贸易等影响较大,且设备投资具有资金占用量大、投资回收期长、投资环境复杂、影响因素多等特点,这使得港口设备固定资产投资存在一定风险,且这些风险往往难以预测。在设备投资辅助决策模块运行状态下,系统根据预测数据和历史数据给出决策建议,并提醒项目管理人员对问题项目进行人工复查。
        3基于大数据的港口设备投资决策系统关键技术
        3.1基于贝叶斯网络的自动分类方法
        以天津港数据为例,基于贝叶斯网络的自动分类方法按照数据属性、功能和用途,将所有数据分为装卸设备、计量、供暖制冷、电力、通信、车辆、信息化、环保、消防和其他等类别。基于贝叶斯网络的自动分类方法的实现流程如图4所示,人工分类的数据样本随机分为训练数据集和分类测试数据集。
        3.2基于反馈神经网络的港口吞吐量预测
        影响港口吞吐量的因素十分复杂,主要可以分为以下两类:(1)港口自身基础设施因素,主要包括码头岸线规模、泊位等级等,涉及的数据包括岸线长度、泊位数量、万吨级泊位数量等;(2)港口外部环境因素,主要包括地理位置、腹地经济、政策环境等,以天津港为例,涉及的数据包括北京市、天津市和河北省的外贸进出口额和三大产业产值等。


        人工神经网络模型由大量的神经元结构和神经元加权连接而成。反向传播神经网络是一种多层的前向性神经网络(包含输入层、隐含层和输出层),具有信号向前传播而误差反向传播的特点。标准反向传播神经网络采用梯度下降算法,网络权值沿着性能函数梯度反向调整。以天津港为例,通过反向传播神经网络分析上一年的港口货物吞吐量和集装箱吞吐量等输入数据,可以预测下一年的港口吞吐量情况。反向传播神经网络的误差与输入存在较大相关性,且误差的自相关性较强,使得系统随着时间推移呈现明显的退化现象,这表明反向传播神经网络需要进一步优化。传统反向传播神经网络的退化现象主要是由过度拟合引起的;因此,引入贝叶斯正规化来增加鲁棒性,通过其参数以概率分布的形式进一步提供不确定性估计。与传统反向传播神经网络相比,贝叶斯正规化反向传播神经网络输入与误差的相关性明显降低,低于可信阈值。贝叶斯正规化反向传播神经网络具有过拟合的特性,其预测结果虽然存在一定误差,但总体在可接受的范围内,未来可进一步用来分析具体时期影响和限制港口吞吐量增长的关键因素。
        3.3设备合理拥有量模型
        预测港口吞吐量是为了针对港口规模及定位进行合理适度超前投资。建立设备合理拥有量模型的主要目的是:合理配置资源,降低设备维修成本,提高设备完好率和利用率,以取得最佳经济效益。
        3.4基于时间序列的设备投资预测
        基于时间序列的设备投资预测的目的在于:对设备投资额数据进行清洗;通过皮尔逊相关系数,确定数据之间的线性关系。针对天津港的实际情况,需要对设备投资额数据进行前期处理:若发现异常值,则需要与港口相关部门沟通,获得合理解释;否则,替换异常值。在预测时,单靠一种方法很难具有说服力,因此,有必要采用多种方法比较拟合精度。
        3.4.1皮尔逊相关系数
        针对港口某个设备投资额数据的皮尔逊相关系数可表示为
        式中:r的取值范围为[1,1]。当|r|≤0.3时,表明不存在线性关系;当0.3<|r|≤0.5时,表明存在低度线性关系;当0.5<|r|≤0.8时,表明存在显著线性关系;当|r|>0.8时,表明存在高度线性关系。
        最后,采取统计列表的方法分析各个设备投资額数据间的皮尔逊相关系数,针对与集装箱吞吐量相关性极强的设备投资额数据,建立一元线性回归方程或多项式回归方程,并用列表的方式标明各个数据之间的皮尔逊相关系数。
        3.4.2ARIMA模型
        ARIMA模型的建模过程如下:首先,对某个时间序列设备投资额数据进行白噪声检验,如果检验结果为白噪声序列,则表明没有预测的必要性;然后,通过设备投资额数据自相关图检验数据的平稳性,通过差分运算将非平稳数据转化为满足预测要求的平稳序列(见图6)。
        3.4.3线性回归分析
        线性回归模型的建模过程如下:首先,对影响设备投资额数据的因素进行定性分析,确定与因变量相关的自变量因素;然后,利用最小二乘法拟合各个变量之间的常数项与系数;最后,拟合方程。针对设备投资预测的多元线性回归模型可表示为
        当式中变量Xk只有1个时,该模型为一元线性回归模型。
        3.4.4灰色预测理论
        在灰色模型分析过程中,对设备原始投资数据的处理十分重要。数据处理方法主要分为累加和累减,其目的是去除或减少其他非主要信息数据的干扰,以便获得数据内在规律,处理后的数列称为灰色序列算子。
        4结束语
        综上所述,基于大数据的港口设备投资决策系统项目主要包括以下内容:(1)基于贝叶斯网络的自动分类方法技术对设备投资项目名称进行分类;(2)基于反馈神经网络技术预测港口吞吐量并分析港口吞吐量影响因素;(3)基于时间序列的设备投资预测模型适用于观测样本少、无法完全提取数据影响因素的情况;(4)港口设备合理拥有量模型用于计算港口码头装卸设备配置数量,以辅助设备采购决策。
        参考文献
        [1]交通运输部.关于推进港口转型升级的指导意见[J].综合运输,2014(7):84-87.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: