中国移动通信集团广东有限公司汕头分公司 广东汕头 515000
摘要:对于大型Web网络信息数据处理中心而言,在其构架之中存在有大量且形式多样的多媒体信息数据资源,而为了对这些资源进行高效且深入的挖掘,促进资源调度水平的有效提升,本篇文章提出了一种以模糊语义的本体映射为基础的高效挖掘方案。将大型Web网络信息数据中心中所存储的各种信息资源流做信息流的重建,借助泛化学习来对资源信息流等进行模糊聚类化处理,并综合语义本体的映射来实现信息特征化提取,将所提取的特征当作训练集,借此开展数据迭代,最终实现资源进一步优化和挖掘。试验结果表明,通过这一方案可以有效提高存储在数据中心的资源综合利用效率,并且整体的运行效率也比较高,能够有效完成各项资源的科学配置。
关键词:技术研究;大型Web网络;中心资源;数据高效挖掘
引言:由于近些年科学与信息技术不断发展,当前应用大型的Web网络所具有的价值也得到了进一步提升,并且数据中心也开始成为网络信息服务工作中的一个重要平台。在现阶段所使用的大型Web网络数据中心的构架结构之中,因为存储的构架结构存在一定差异并且数据间也会相互扰动,因此资源挖掘以及调度准确性相对较低,极易发生数据的冗余等问题,而为了有效解决这一问题,本篇文章便提出了一种全新的资源挖掘技术,并对其做了相关的测试,希望借此可以为用户提供一定帮助。
一、结构模型
1.分布式的结构框架
想要高效与科学的挖掘在大型Web网络数据中心中存储的信息资源,对数据中心资源分布式的结构模型进行分析是必不可少的一个环节,另外还需要对资源信息流中的时间序列以及多维信息的特征进行拟合与重组。借助优化资源挖掘方式,来让大型Web网络数据中心资源的调度以及访问等能力得到有效提升。对于大型的Web网络数据中心而言,其内部数据库储存的节点一般借会助构建分布式的结构来把各类资源有序储存于大型的Web数据库之中,而数据库则通过云存储的框架模型来执行数据读取等操作,把大型Web网络数据中心的资源数据做二值图的模型构建后,所得到的具体的表示形式是G=(V,E)。在挖掘相关数据时,对所采集到的数据资源做信息分类处理,A,B是分类集合,并且融合聚类中心符合A∪B=V,A∩B=∅。倘若把大型的Web网络数据中心数据储存模型当作一个分布节点(G1=(M1α,M1β,Y1)),并且网络数据中心的访问接口处信息融合的中心函数符合t,设
mi的一阶导=-aimi(t)+bi(pi(t-σ),p2(t-σ),……,pn(t-σ));
pi(t)的一阶导=-c¬ipi(t)+dimi(t-τ)
是资源信息分布模糊化的概念集合,由数据的分块之中挑选出k个实例集,构建起挖掘数据资源的聚类目标即:
μik=1/
.png)
2/m-1 (1)
Vi=
.png)
mxk/
.png)
m (2)
针对上述的聚类目标函数做极值优化求解处理,可以得到挖掘的模糊概念集是:
U={μ¬ik|i=1,2……,n} (3)
.png)
ik=1,k=1,2,……,n (4)
当资源分布4层量化的信息结构模型被确定之后,借助分布式的结构框架,可以得到大型的Web网络数据中心资源的分布式信息架构模型,在经过二元拟合后为:
D(C1,C2)=
.png)
(5)
Mint(C1,C2)=min(Int(C1)+τ(C1),Int(C2)+τ(C2)) (6)
在大Web网络数据中心资源分布式的框架模型之中,开展信息融合还有数据的聚类处理等工作,能够让资源实现高效且充分的挖掘。
2.信息流模型
对于大型的Web网络数据中心而言,其在对向量集进行查询时通常利用查询接口来直接提取出相关的信息特征,从而构造一个大型的中心资源的信息流模型,通过资源信息文本块的学习其还有实例学习器等创造一个资源信息的分布本体模型:
C=Min{max(Ci)} (7)
i,j,j=1,∀i∈(1,n),∀j∈(1,n)(8)
借助本体映射的方法来建造一个数目为n的特征分类属性的能够映射大型Web网络数据中心的数据库的关系,借此对本体内部各个元素间的语义的相似程度进行计算。将决策信息的融合法应用到资源的储存空间当中,资源信息流的分布贝叶斯粗糙集则可以写成:
.png)
在上述式子当中,b(τ,φ)所代表的为大型Web网络数据中心中的资源有限论域;而f(~)(t)则代表的是资源挖掘客观的推理准则。在对资源信息流的分布信息函数进行构建时,f:U*A右→V,借助傅里叶函数变换对时频特征进行分解,具体的过程为:
.png)
在上述式子房中,f(t)指的是大型的Web网络数据中心非稳定态的特征值;ρ(a,b)是边界区域内BND*A(X)的时频联合分布;a则是分类的特征参数,而b则是置信增益的函系数,其在语义本体的负域即NEG*A(X)还有边界域即BND*A(X)中,所得到的二值决策的模型是:
.png)
二、对资源进行高效挖掘的实现
当完成了大型Web网络数据中心中数据信息资源的信息流重建工作之后,还对资源科学及高效化的挖掘算法进行了优化设计,同时还在此背景下提出了以模糊语义的本体映射为基础的资源科学和高效化的挖掘技术,并借此建造了一个能够对信息流的时间序列进行分析的模型,从而得到了有关于网络数据中心的边缘性情况的函数,即:
.png)
在上述式子当中xi∈Rn所代表的为大型Web网络数据中心中锥形核的分布状态矢量,而ui∈Rm则代表一个核函数。借助特征量化的分级法对资源信息进行重组,其表达式是:
U=[u1,u2,……,uN]∈RMn (15)
经计算可得到多媒体资源最大的挖掘梯度是:
.png)
在上述式子当中资源信息的语义指向性表达式用
.png)
来表示,而m和n则分别表示多媒体资源维数以及频数等。
三、仿真试验以及结果分析
开展仿真试验最主要的目的即对本篇文章所提出的算法进行测试,并观察其在资源挖掘过程中的实际性能。在试验过程中,采用的软件工具为Matlab 2010b,而网络数据中心的数据库则使用的是DeepWeb 200GB,第一个环节需要先开展资源信息原始数据的采样工作,采集的资源信息流程度是0.24,采样周期T是0.04s左右,试验的信噪比是-10dB,选择μ0=0.001作为信息聚类的自适应最初步长。按照仿真参数以及环境设定,开展资源仿真研究和分析,对信息流进行重建处理,在重建过程中时域的实际波形图即下图1。
.png)
图1.信息流的采样数据
对由图一中收集到的资源数据进行对应的泛化学习以及模糊聚类等处理,并按照其语义本体映射等将互信息的特征提取出来,进而达到资源挖掘的目的。下图2即所得到的挖掘精度的对比示意图。通过图2可以发现,借助本篇文章提出的方法能够有效提高资源挖掘精度,并且性能也更为出色,最终效果也较为理想。
.png)
图2.资源挖掘精度的比较示意图
结束语:
尽管大型Web网络数据中心为用户检索需要的信息资源提供了极大地便利,但是就目前实际的应用效果来看,该技术仍旧存在一定的缺陷,例如无法精准的对资源进行挖掘、数据冗余问题时常出现等,为此本篇文章对当前在大型Web网络数据中心中存在的与资源挖掘相关的问题进行了深入分析,并在综合多方影响因素的前提下提出了以模糊语义的本体映射为基础的高效化挖掘技术,同时还对该技术进行了相关仿真试验。通过仿真试验的实践应用发现,借助该技术开展资源的挖掘工作时准确定位的性能极为出色,并且资源调度的能力也十分突出,值得进行大力推广以及应用。
参考文献:
[1]颜振祥.互联网双语资源挖掘关键技术研究[D].
[2]刘鎏.数据中心高效资源管理关键技术研究[D].
[3]李龙.数据中心网络性能优化技术研究[D].2016.
[4]陆菲菲,郭得科,方兴,等.数据中心网络高效数据汇聚传输算法[J].计算机学报,2016,39(009):1750-1762.
[5]丁伟伟.基于Web信息资源数据挖掘技术研究[J].长春理工大学学报:高教版,2012.