大数据解析技术在大气环境监测中的应用--中国期刊网

字体：大中小

首页> 原创作品> 正文

大数据解析技术在大气环境监测中的应用

发表时间：2020/7/3 来源：《科学与技术》2020年2月5期作者：王文雷

[导读] 在大数据时代，信息技术得到飞速发展，其技术也被逐渐推广开来。

         摘要：在大数据时代，信息技术得到飞速发展，其技术也被逐渐推广开来。尤其是信息解析技术的发展，被广泛应用于各行业。本文主要介绍其在大气环境监测中的具体应用，对数据收集和处理过程中的要点进行了深入分析，希望能够为我国环境监测工作带来一些提示。
         关键词：大数据解析技术；大气环境监测；分类器
         大气环境问题，直接关乎人民群众的身体健康，我国对环境问题尤为重视。大气环境保护需要社会各界的参与，环境监测部门是主要技术支撑部门，需要对收集整理的数据进行分析。通常包括天气状况、人员流动量、大气污染情况、交通状况等。但是，这些数据信息都是分散的，因种类不同，它们之间的关系是比较复杂的，环境监测部门需要应用大数据解析技术对这些分散的数据进行解析。因此，大数据解析技术对于大气环境检测工作至关重要。
1大数据解析技术在大气环境监测中的应用
         大数据解析技术主要包含的内容有：数据收集、系统智能化模拟分析和计算等。在环境监测工作中，收集的大量信息都要经过处理，通过分析获得有价值的参考信息。本文立足于大气环境监测工作，通过计算部分地区的大气PM2.5浓度，以此分析大数据解析技术对大气环境监测的作用[1]。这一过程体现在研究问题的准确性、特征性及数据性的选取及处理，时间及空间数据的建立和处理上。以下介绍其应用的技术要点：
1.1应用大数据解析技术主要目标及具体内容
         大数据解析技术通常把繁杂的数据进行精准处理，一般依据数据分析原理，对于各种问题进行分析。首先，就要对主要目标和具体内容进行确定。本文研究的问题就是大气环境监测，主要目标就是对城市部分地区进行大气环境检测，内容就是计算这些地区的PM2.5浓度，主要划分方式就是选择单元网格。使用G（g1，g2，…，gn）对单元网格进行数据描述，g表示1平方千米以内的描述，使用C（cg1，cg2，…，cgn）表示g范围内的PM2.5值，以J（Ci）代表此运算的目标函数。其中Ci具体可以分成两个类型，一种类型就是对于区域范围内有自动监测站的，可直接获得PM2.5值，用C1表示；另外一种就是区域范围内未设置自动监测站的，需要进行数据分析，PM2.5值用C2表示。

1.2特征量与数据类的确定
         C2没有监测站，PM2.5浓度值不能直接获取，需要进行数据分析，那么就要确定特征量和数据类型。在确定时，可以选择“可能”及“需要”原则，前者是在数据已知条件下，后者要经过J（Ci）函数处理。具体分为：在环境问题的处理上，数据间多是非线性，呈多元化特点，这样处理复杂性增加，难度也较高。因此，必须以环境知识为基础，对现有数据进行科学分析，最后确定数据类。主要考虑气象数据、人员活动状况、交通情况、空气污染程度、过去已知的PM2.5数据，并对有关位置进行核实，接着对特征量进行选取。其中气象数据的特征量选择风速、压力、温度；人员活动的特征值选择人员的数量；空气污染程度选择如车站、商场等人员聚集多的场所数量为特征值；交通状况的特征值选择车流量；已知PM2.5浓度的特征值选择一段时间内的均值。这些特征值有的会随着时间的改变发生改变，通常要对其进行种类划分。包含空间类和时间类。空间分类器可以进行函数预算处理得到结果；主要处理空间类数据，时间分类器可以进行目标函数运算，处理因时间改变而改变的数据集[2]。因此，在应用大数据解析技术时，要掌握两种分类器的构建。

期刊文章分类查询,尽在期刊图书馆

1.3时间分类器的选取
         时间分类器的使用，可以处理因时间动态变化的特征量。交通情况的数据集中，特征量有车的数量；气象状况中，风的速度、压力和温度是特征量，人员流动中，人员流动量为特征量。如果以i代表某网格点，以j代表某特征量。该类特征量以xij代表，t代表某一时刻。那么就有X=｛x1，x2，…，xn｝，x1=｛xi1，xi2，…，xij，t｝。在大气污染物浓度数据集中，浓度随时间改变，是特征量，选择yi代表，用i代表某网格点，于是就有Y={y1，y2，…，yn}。如果特征量确定起来很简单，那么yi和邻近yi-1存在某种关系。用i-j代表变量邻近，那么概率P=（Yi/X，Yj，i≠j）。在此条件下，如果X序列已知，假如存在y值，那么以正态分布函数exp（u·s（yi，xi，i））表示。函数exp（λ·t（yi-1）代表向i状态转移。U和λ可以通过条件概率函数进行求解。目的就是要使求取结果满足问题需求。也就是说在此过程中，要保障空间分类器和时间分类器的建立是最佳选择。
1.4空间分类器的选取
         空间分类器因其稳定性，一般表现出线性传递的方式，通常被归为静态神经网络类型中。在数据分析中，也是重要的数据分析工具类型。此次问题研究中，网格PM2.5浓度的测定，就可以使用该人工神经网络ANN参与的空间分类器。当它获得数据时，就会通过节点传送出去，对目标值产生影响。但是，要注意解决节点神经移动和权重的问题，可以运用反演法。通过对输出权重进行合理分配，对偏差进行再分配，实现其合理性。在运用中，可以进行多次分配，将其偏差尽量缩小，保障其准确度，使特征量的解析作用达到最大。
2在大气环境监测中运用大数据解析技术的实施要点
         在大气环境监测中运用大数据解析技术，其工作要点是要把具有联系的数据进行分类，接着对特征量进行选取，运用数学解析的方式进行计算，对特征量之间的联系进行解析，最后实现处理解决问题的目的。大数据解析技术应用范围比较广的原因在于其能够处理难度较大的非线性因素，且对于多元关系的处理也十分奏效。本文选取的研究对象就是大气环境监测问题，虽然经过运算能够获得最后结果，但是，在实际操作中还是要注意一些问题。主要问题有：一是对于最初数据的收集整理，因为前期数据众多，获得的数据准确性不高，一些特征值在获得时要经过一些统计学处理；二是特征量的选择。在面对各种问题时，无论情况多么复杂，在获得基础数据后，都要进行特征量的选择，通常要进行挑选，目的是为了提高其正确性；三是对于数据工具的使用。绝大多数特征量，对于数据工作都有所要求，一些特殊的情况还要用到很多解决方式，这是就需要特定的数据工具[3]。另外，大数据解析技术就是需要大量的技术和计算处理加以支持的。因此，在具体操作中，需要责任部门对数据的一系列处理都是专业的，目的就是保证其准确性。
3结语
         我国对于环境问题十分重视，环境整治工作也在不断进行中，也是社会比较关注的话题。环境问题的分析中影响因素比较多，比如不同范围、地区划分等，都会对分析有所影响。在具体分析中，要根据各地方的环境状况进行科学分析，要同时考虑其他环境因素，比如水源和土壤状况，它们之间是存在密切联系的，也是相互影响的[4]。在实际检测中，也是难度较大的。在大气检测中使用大数据解析技术，那么必须要确定流程及各环节的注意事项，具体表现在研究问题的范围、数据类型的选取及特征量的选择，最后通过合适的数据分析工具，准确计算出符合监测需求的结果。
参考文献：
[1]曾羽琚. 基于大数据的大气监测研究[J]. 电脑知识与技术,2018,14(07):15-16.
[2]贾瑾. 基于空气质量数据解析大气复合污染时空特征及过程序列[D].浙江大学,2014.
[3]张哲. 基于大数据应用的环境数据资源中心设计研究[D].清华大学,2017.
[4]王海涛. 基于大数据的景观格局时空演变及其环境效应研究[D].天津大学,2017.