摘要:随着科技的发展,我国进入互联网时代,这便使得互联网中的大数据被越来越多的人使用和重视。信息时代,群众可以从互联网中了解到自己想要的讯息,不管所属何种领域,都会挖掘大数据的经济价值以及科技价值。在目前对于分析大数据的方法来说,难度系数较高,是需要研究出一种新的分析方案,帮助挖掘大数据中存在的更多经济价值和科学价值。在当前可以采用无限深度神经网络方法来分析大数据,这种方法可以对大数据中的信息进行综合、整理、分析,为人们筛选出具有价值的信息。在本文中,将会对大数据分析的无限深度神经网络方法进行分析,希望对有需要的人有所帮助。
关键词:大数据 无线深度神经网络 大数据分析
引言
在当前,多个领域都在对大数据中存在的价值进行挖掘以及应用,在市场中,衍生了多个新生的行业,促进市场经济的发展。在我国战略发展规划中,对互联网中的大数据挖掘早已进行部署,并且对大数据中隐藏的信息和价值进行相关的研究。在本文中提到的使用无限深度神经网络方法来分析大数据,这种方式主要是将人类的大脑作为原型来创建的一种对大数据进行处理的方式,这种方法可以采用深度学习的方法,来对大数据中的信息进行挖掘,在目前对大数据进行挖掘的方法中,无限深度神经网络方法是效率最高的处理方式之一。
一、大数据的概念
在互联网中,将非常庞大并且很复杂的信息数据进行集合这现象称为大数据。大数据中,包含的信息量非常庞大、覆盖的行业非常广泛、并且还包含了全样本数据,但是在大数据中单条数据的价值是非常低的,而且每一条数据之间的相关性较差。由于大数据中的信息量庞大,来源也是非常的复杂,这便造成了在处理大数据信息时,出现一定的困难,并且在大数据中,它的数据量还在不断的生长,给人们使用大数据信息带来了极大的困难。在对大数据中的有效信息进行挖掘时,最常见的手段是数据平台、分析平台。采用数据平台这种方式主要的目的是将大数据中的信息进行收集并且对其进行处理,对分析出来的数据进行分类并保存。而采取分析平台的方法主要是对大数据进行合理的分析、计算,并且把具有价值的信息进行具象化,当人们对大数据进行分析时,是必须使用计算机这种平台来进行的。
二、无限深度神经网络方法
神经网络在目前人工智能的信息时代中,可以有效的模仿人们大脑神经的进行信息数据处理的数学模型。尤其是在我国进入二十一世纪之后,在神经网络的基础上,创立了深度学习的方法,在这样的情况下,使的神经网络充分发挥自身的计算分析的能力,并且逐渐被有关学者运用到大数据分析的领域中来。无限深度神经网络这种方法,在对大数据进行分析时,具有非常重要的作用,有非常出色的表现,在时间运行的过程中,神经网络可以实现“无限深度”,也就被称为“无限深度神经网络”。神经网络这种算法是属于一种模仿人的大脑机制的算法,这里所说的无限深度网络主要是说前馈神经网络。所谓的前馈神经网络,学习能力非常强,具有语音和图像识别的功能,运作时产生的极高的效率。
无限深度神经网络方法主要是将人类的大脑作为原型来创建的一种对大数据进行处理的方式,在使用无限深度神经网络这一名字时,就说明需要从网络计算的这个角度来作为出发点,重点放在研究网络的学习方法以及训练的方法,无限深度神经网络在本质上是属于一个动力学的系统,是能够起到处理动态数据的作用的,所谓的动态数据其实就是指和时间有关联的数据。
大数据被越来越多的行业所运用的同时,GPU等各种更加强大的计算机设备的发展以及对大数据更深层次的训练网络的新思路也随之被提出来,数据变得越加的丰富,深度学习的方式也在大数据分析中得到很好的使用。无线深度学习便可以利用各种数据来自动的将所学习到的数据中比较抽象的相关内容进行具体的表达出来,也就是说把最初始的数据变成某一种知识。无线深度学习可以有效的提高任务的准确性,在短短的几年时间里,无限深度学习的方法已经将图像理解、文本理解原有的算法及思路完全的颠覆,渐渐的使之形成一种从训练数据为出发点,经过一个端口到另一个端口的模型,然后直接输出便可以得到最终的结果。
三、神经网络的算法
深度神经网络最突出的特点便是学习能力强,可以有效的解决分类中的各种需要识别的问题,比如语音识别、识别图像等情况。在近些年以来,深度学习的方法可以有效的获得各种标志性的记录。在大数据分析的过程中,分类是一个非常长远和重要的目标。而且另外一个核心的任务便是需要对数据进行预测,以及预测数据将要发生的变化。也就是说需要提取数据中的时序特征。但基于深度神经网络的拓扑结构本身具有一定的限制,是可以通过“Bus Driver”这个问题来说明的。“Bus Driver”是可以帮助在验证过程中算法动态提取能力的序列识别问题。“Bus Driver”主要是需要在动态的干扰中来识别顺序所发生的时间。从下面的图画中可以了解到,深度神经网络算法主要是把一个神经元来作为一个出发器,而另外一个主要是作为输出器,设置4个输入,采用随机的方式在这4个端口中输入数字1,其他的端口都可以输入数字0,这些数字要与a、b、c、d中的某一个字母相对应,比如在a这个字母之后出现一个b,那么网络的输出就是0,相反,如果输出的是0,那么就可以实现所谓的“Bus Driver”。
图1 “Bus Driver”的问题叙述
图2 使用无限深度神经网络来解决“Bus Driver”问题的结构图
“Bus Driver”的算法:
(1)性能函数
神经网络是基于模拟神经元连接权值上来建立的,进而进行计算和分析。因此,关于“Bus Driver”的算法便属于调节网络神经节点权值的算法。
wnew = wold + Δw (1)
对此计算的任务一般是使用J(w)来实现权值优化的,那么就会有
wnew = wold + α w J (2)
在这个算法中,α代表的是学习的效率,而 w J代表的则是参数的梯度。
可以使用有监督的学习序列来输入,不管是在任何时候t,它的神经元k的网络性能函数是:
J(t)= 1/2 [ ek ( t ) ]2 (3)
这种方法就是属于阶段训练的方式。
把开始和结束的时间设置为 t0 和 t1,那么它的性能函数便会转化为:
J(t) = 1/2 J(τ) (4)
这便是属于应连续训练方式。
(2)关于深度神经网络学习的算法
在深度神经网络学习的算法中,其中BP算法是当前最为经典的训练前馈网络算法的方法之一,而使用的BPTP方法,又是在BP算法的基础上进一步的进行延伸,比如使用的无限深度神经网络方法,这是一种回复式的网络,是将阶段训练的方法和连续训练的方法进行有机结合,便可以使得 EpochBPTT、Real-BPTT 这两种较为经典的算法得以实现,在本文中,采用的是长短时记忆来改善梯度爆炸以及梯度消失的这两个问题。
四、结语
在当前身处大数据时代,想要对大数据中的数据进行有效的处理,越来越多的人使用无限深度神经网络算法,这种方法被人们广泛的关注,也是在最近几年甚至是未来的几年,都是人们所关注的热点,无限深度神经网络所蕴藏的潜力还等待相关人员进行研究,它具有非常强大的数据分析能力,在将来也会有更多的理论和先进的方法被人们提出来,并且不断的运用到大数据中去,不断的提升应用的效果,同时挖掘更多有利于社会发展的大数据信息。
参考文献
[1]孙慧婷 , 闫磊 . 基于大数据分析的复值 BP 神经网络方法 [J]. 佳木斯大学学报 ( 自然科学版 ),2018,v.36;No.155(04):55-58.
[2] whlte Paper on Blg Data of the Telecommunlcations Research Institute ofthe Ministry of Industry and Telecommunications(20l 4)[M].Beijing:Telecommunications Research Institute of the MmlsHy of lndustry and Information Technology,2014(in Chmese)(工信部电信研究院大数据白皮书(2014)[M].北京:工业和信息化部电信研究院,2014)