探索智能算法在半自磨机运行状态上的研究

发表时间:2020/11/11   来源:《基层建设》2020年第21期   作者:孙静
[导读] 摘要:半自磨机在选矿工艺流程中起到至关重要的位置,为了能够捕捉到半自磨机相关的运行数据加以挖掘和学习,并对半自磨机运行状态进行分类。

       中国黄金集团内蒙古矿业有限公司  内蒙古满洲里  021400
       摘要:半自磨机在选矿工艺流程中起到至关重要的位置,为了能够捕捉到半自磨机相关的运行数据加以挖掘和学习,并对半自磨机运行状态进行分类。主要谈论各变量与半自磨机功率之间的关系,阐述的是一种数据分析方法和智能算法在选矿自动化中探索性的应用。智能算法能够推动工业自动化的实现,通过观察生产线和数据流来学习,并能够精确优化生产过程,降低生产成本,从而节省人工分析数据的时间成本和资金成本,提升生产工艺装备的自动化和智能化水平。
       关健词:智能算法;数据分析;半自磨机;分类
       Exploring the Application of Intelligent Algorithm in the Classification of Operating Conditions of semi-autogenous mill
       wu-di
       China's gold Inner Mongolia mining co., LTD,neimenggu manzhouli 021400
       Abstract: The semi-autogenous grinding mill plays a crucial role in the beneficiation process, in order to be able to capture the relevant operating data of the semi-autogenous mill for excavation and learning, and to classify the operating conditions of the semi-autogenous mill. It mainly discusses the relationship between each variable and the power of the semi-autogenous mill, and expounds the exploratory application of a data analysis method and intelligent algorithm in beneficiation automation. Intelligent algorithms can promote the realization of industrial automation, learn by observing the production line and data flow, and can accurately optimize the production process, reduce production costs.thereby saving the time cost and capital cost of manual analysis of data, and can improve the production process equipment automation and intelligence level.
       Key words: Intelligent Algorithm; data analysis; semi-autogenous mill;classification
       1、引言
       探索性的将智能算法技术应用到半自磨机运行状态分析与预测中。实验性的在行业中应用才具有真正的革命性
       中国黄金集团内蒙古矿业有限公司选矿厂二厂(以下简称乌山选矿厂)地处内蒙古自治区新巴尔虎右旗境内。是由长春黄金设计院设计单系列日处理量为4万吨的选矿厂。拥有AB、GE两个大型自动化控制系统。拥有大型的历史数据库,对选矿流程设备的运行数据进行存储,智能算法能判断哪些因素对磨机的影响最大,哪些影响最小,从而为产品和效率带来质的提升。
       2、数据处理
       2.1统计数据
       乌山数字化基础良好,拥有强大的历史数据服务器,并且全部为结构化数据,通过提取近一年的半自磨机运行数据进行探索。部分数据见表1。并对数据进行统计汇总,统计结果见表2
       表1 半自磨机运行参数部分数据

       表2 半自磨机运行状态参数汇总统计量

       通过表1可以看到每个特征值的五数汇总的统计量,最小值、第一四分位数、中位数、均值、第三四分位数、最大值。可以看出测量中心趋势的指标平均数,它落在数据的两个极值之间的某个位置,可以把它用来与其他值进行参照。中位数和均值是很类似的度量,尤其是均值他对异常值或是那些对大多数数据而言异常高或低的值是非常敏感。均值对异常值是非常敏感的,所以它很容易受到那一小部分极端值得影响而改变大小。第一四分位数和第三四分位数,1/4的值小于Q1和1/4的值大于Q3和中位数一起,把一个数据集分成4部分,每一部分都有相同数量的值,Q1和Q3之间50%的数据就是数据分散程度的一个测度。数据分布情况可视化如图1
 
       图1各数据分布情况
       2.2噪点检测
       对于特征变量功率,通过表2可看到最小值(3680)、最大值为(6190)、最小值和Q1之间的差值是(1110),Q3和最大值的差值是(760),然而Q1和中位数的差(370),以及中位数和Q3的差(270),可以看出中心周围的值聚集得更加紧密,数据为“正态分布”。同理可以得到其余特征变量的数据的分散程度。正态分布可以表示成一种概率密度函数。
             (1)
       ∂表示数据集的方差,u表示数据集的均值,x表示数据集的数据。对于正常数据,噪声数据可以理解为小概率数据。
       正态分布的特点是x落在(u-3∂,u+3∂)以外的概率小于千分之三。根据这种特点我们可以通过计算数据集的方差,将3倍方差之外的噪声数据排除,其他特征变量可同理排除噪声数据。返矿量正态分布曲线如图2
           (2)
       
                             图2 返矿量正态分布曲线
       2.3检验变量之间的关系
       通过可视化可以观察到功率和返矿量之间的关系,功率与返矿量散点图如图3所示,不是所有的关联都形成直线,看上去随着x轴变量或者y轴变量的增加而变弱或者变强。这样的关系说明两个变量之间,不是线性的。
 
       图3功率与返矿量散点图
       2.4特征降维
       特征降维可以把对结果没有意义或者说意义非常小的字段去掉,减少不必要的干扰,降维是一种信息损失较小的线性降维方式。求协方差矩阵,协方差是表示不同维度数据间关联的一种统计学算法,前面提到的方差是针对单一维度的变化,协方差可以表示维度之间的信息。
               (3)
       x为返矿量,y为功率,`x为返矿量平均值,`y为功率平均值。
       如果结果为正值表明顽石反量x和功率y正相关,顽石返量越大功率增长越快,如果为负值表明顽石反量x和功率y负相关,顽石返量越小功率增长越快。如果为零表示两个属性没有线性关系,有时相关性并不能全部代表某一个特性。通过协方差矩阵来解决多维度数据问题,将特征值按照从大到小的顺序排序,保留前N维的特征向量,将矩阵降维到N维。目的是在降维的过程中尽量保证数据的信息量不受到损失。通过矩阵将特征向量和特征值全部求出来。
                  (4)
       针对顽石返量、功率、轴压分别为x、y、z
                  (5)
       2.5标准化数据
       通过表1可看出各特征数据数值大小波动非常大,这样的数据对计算的影响很大,所以要去除量纲给计算带来的影响,利用标准化方法重新调整特征变量数据值。使数据的范围在0~1之间。标准化后部分数据见表3。
 
       表3 标准化后部分数据

       3模型推导
       使用五数汇总的统计量中心趋势和分散程度统计计量来检验数值变量,用散点图和主成份分析进行变量间相关性测试,分析检验了数据集。已经准备好了使用智能算法方法来建模的数据。通过哑变量将目标类别抽象成1和0。将因子抽取出来作为类别,对数据进行分割。部分数据见表4
       表4 创建哑变量后部分数据

       模型的最终结果是一组特征的系数,每个特征有一个系数相乘。
       y=w1×功率+w2×轴压+w3×返矿量+w4×给矿量+w5×磨矿浓度+C
       w1,w2,w3,w4,w5是通过模型训练得到的模型系数,C是常数项。
       S函数
                             (6)
       通过S函数可以将结果均匀地表示在[0 ~1]的范围中,特性曲线如图4所示
 
       图4 Sigmoid函数特性曲线
       模型带入可得:
 
       利用最优化算法梯度下降法求出权重
                         (7)
       ∂表示(步长)梯度的乘积系数,XT表示训练特征数据矩阵的转置,error表示每一次迭代的梯度。设∂的数值为0.001,作为每次迭代的步长。
       特征矩阵X表示为部分数据
 
       转置之后,XT为  
 
       目标列向量Y
        
       error梯度的求解:
                  (8)
       S(XWt)是把第t次的模型权重和特征矩阵的乘积带入Sigmoid函数计算,设Wt=(1,1,1),Sigmoid(XWt)的计算方式
                    (9)
       通过以上方式不断迭代Wt+1=Wt-∂XTerror直到达到收敛条件。
       3.1分类
       通过Sigmoid函数以及最优化算法可以得到一个模型,下面通过这个模型进行数据分割。最终生成的模型Wt =(0.45 2.1 1.4),常数项C=0.18当我们有一条Test数据集为Test=(4500,6.1,110)则对Test的分类函数为
               (10)
       yTest被Sigmoid函数限制在[0,1]的区间内,将模型的结果设置一个阈值Z=0.5。当ytest<Z时,就把Test的模型判断结果设成0,当ytest>Z时,将Test的模型判断结果设成1,。这样整个智能分析模型的分析过程就完成了。
       4 结论
       通过乌山二期磨机数据分析可以得到磨机实际运行数据的各个变量之间的关系,并且应用智能算法可以将各状态数据进行数据分割。可以在保证数据准确率的情况下实现磨机各运行数据的有效分割,达到多属性降维,在不损失信息量的情况下通过少量的运行数据解释磨机当前的运行状态。

 

投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: