基于大数据技术的在线教育信息采集平台研究

发表时间:2020/12/15   来源:《科学与技术》2020年22期   作者:续可为
[导读] 数据收集是一个耗时的过程,从不同地理位置收集数据需要利用该技
        续可为
        太原供水集团有限公司 山西省 太原市 030000
        摘要:数据收集是一个耗时的过程,从不同地理位置收集数据需要利用该技术进行数据收集。尽管使用各种采集手段进行教育信息收集,但成千上万的教育提供者中的计算机因操作系统、软件、版本、网络平台等的差异造成采集平台在数据源汇聚过程中存在问题。在异构环境中,计算机间的数据传输是一项具有挑战性的任务,由于计算机系统的异构性,在线数据收集变得更为困难。而WebService服务基于一组标准,使计算机间可以互操作,并且在技术上提供了在异构环境之间进行交互的可能性。该服务支持XML格式,XML是用于通过互联网在应用程序之间进行通信的标准语言。
        关键词:在线教育;大数据技术;数据采集平台;教育信息提供
        引言
        随着信息技术的快速发展,在社会发展中,数据信息的作用变得更加明显。在大数据时代下,每个行业都一定要全面的分析如何使用数据信息来协助企业制定对策。在分析数据的时候,比较流行的一种方法就是用统计学来进行分析,这样可以帮助相关人员找出其中有价值的内容,并且制定出合理的策略。不过,在大数据时代中,统计学方法存在一些问题,以往的方法无法准确的收集大量的信息数据。因此,为了可以更好的进行统计学分析,就一定要比较大数据技术和传统统计学分析方法中的特性,这样才可以有效地发挥出彼此的优势。
        1教育大数据与学习分析
        1.1教育大数据
        随着大数据的传播与应用,研究者将这一理念引入教育领域,提出了教育大数据(BigDatainEducation)的概念。目前,学术界对教育大数据尚未有明确的定义。我国学者杨现民等认为,教育大数据是指根据需要从教育活动过程中采集到的、存在潜在教育分析价值并促进教育发展的数据集合。教育大数据直接产生于各类教育活动,每个教育相关方既是教育数据的消费者,也是教育数据的生产者。教育大数据可以在提升教育质量、实现个性化学习、辅助教育科学决策、优化教育资源等方面发挥重要作用。
        教育数据挖掘(EducationalDataMining)是大数据在教育领域的主要应用,其价值在于通过数据挖掘揭示学习过程中存在的潜在关联关系和关联规则,促使教育评价从宏观群体评价走向微观个体评价、从单一评价走向综合评价、从经验主义走向数据主义,优化学习行为和教学行为,促进教师开展精准教学,帮助学习者实现个性化学习,开展以教育数据分析为支持的教育决策,提升教育危机预防与安全管理能力。
        1.2学习分析
        学习分析(LearningAnalytics)的定义起源于美国高等教育信息化协会的“下一代的挑战”计划,主要指使用数据和模型预测学习者收获和具备处理这些信息的能力。美国新媒体联盟对学习分析的定义为:利用数据采集工具和统计分析技术,分析研究学习者参与学习活动、学习过程、教学活动的相关数据,进而对学习、评价和教学进行干预和修正。我国学者顾小清等认为,学习分析是运用数据分析模型和分析方法分析并解释与学习活动、学习行为相关的数据信息,以探究学习行为和学习过程,发现学习规律,为学习者提供学习表现反馈,促进更加有效的学习。
        2系统设计
        2.1基于XML的文档交换
        在线教育所要求收集的数据是相关、可靠和及时的。DCF必须以一种不言自明、易于理解和易于填充的方式进行设计,同时DCF不应太长,以免采集过程数据提供误差增大避免提供数据。因此,问卷调查设计应小巧、易于理解及方便填写。采用XML模式在接受统计数据(例如:班级总数、教师、学生)以及详细数据(例如:所有教师的详细信息)。XML模式需要单行输入统计数据,而多行输入详细数据。
        2.2OECS架构设计
        OECS是一项基于Web服务,用于从教育数据提供源进行数据收集。由于成千上万的教育数据提供者具有不同的计算环境,因此无法进行计算机到计算机的数据传输。OECS利用Web服务进行数据收集,Web服务与平台无关,可以从任何平台访问以XML格式存储的数据。OECS以XML格式将DCF发送给数据提供者,并且还以XML格式检索填充的数据形式。这样可以实现计算机到计算机的数据传输。由于数据提供者不需要即兴使用其计算工具进行数据填充,因此与集中式数据输入系统相比,数据提供者可以输入数据,分散数据输入可减少错误并及时收集数据。
        2.3使用基于Web服务的界面进行数据收集
        针对异构环境中的计算机间的数据传输需要使用Web服务,Web服务与平台无关,可从任何平台访问以XML格式存储的数据。基于Web服务的界面用于从数据提供者收集数据,为了确保独立于平台的移动性,DCF以XML格式发送和接收,采集对象需要导入XML模式并以XML格式导出数据。
        3区域教育数据网络建设以及要解决的问题
        3.1区域教育数据网络建设的方向
        区域教育数据网络建设,首先需要明确建设的思路。具体来讲:(1)制定统一的区域教育数据网络建设计划,从细节逐步填充。即根据建设区域的教育发展现状、未来教育发展战略、教育需求,统一衡量制定有重点、有秩序的建设规划。(2)数据网络的建设规划,需要从教育需求出发,从数据、平台、机制等角度出发,思考其与当地区域教育需求的结合点与连接点,确保数据网络建设规划能够落在实地。(3)数据网络建设,需要搭配完善的数据安全保护机制,确保所获取、使用的信息安全性,避免信息安全泄漏的事故发生。除了安全保护系统的搭建,还需要完善信息使用管理以及监督制度,而且,在未来的运行过程中,始终完善安全管理机制。最后,建设自身区域教育信息的外接口,区域教育数据网络不是一个封闭性的数据信息系统,而是可供内部使用,也可在符合规定的情况下,能够满足上级要求以及和外部协作交流需求的。
        3.2区域教育数据网络建设攻克的难题分析
        我国区域教育面临着教育不平衡、教育决策不科学不严谨、教育共性化、教育信息透明度不足、不对称等情况。具体来讲:(1)我国区域之间,由于经济、技术以及历史教育水平、经费等投入的差异,导致各个区域的教育有着较大的差距,一定程度上加大了教育的不公平性,对于当下全民教育公平的改革与发展,是有着阻碍的负面影响的。而且,伴随着大数据、信息技术的应用,初期阶段,由于处于“摸着石头过河”的探索阶段,在信息数据的收集和处理方面,存在着较大的困难。(2)我国多数有关教育的决策、决定、计划的制定,没有完整的科学研究体系作为支撑,主要依靠相关工作人员的经验、或者整体社会发展趋势,一定程度上,这种方式的教育决策、决定以及计划,缺乏科学性、合理性,在实用性、实践价值方面仍待考察与验证。(3)班级授课教学模式下,我国虽然部分区域开展了分层教学、翻转课堂等多元结合的教学方式,但是,从实质上看,其仍属于共性教学、统一教学的形式,适宜学生发展与成长的个性化教学进展较为缓慢。另外,教育信息透明度不足,由于主客观原因,而客观存在的教育信息不对称现象,一定程度上影响了区域教育公平性的实现和发展。
        4大数据技术与传统统计学分析方法的比较
        4.1大数据技术和传统统计学分析法的相关性
        以往统计学的分析方法发展的时间比较长,这种方法不管是在社会中运用还是基础理论都是比较完整的,而且有很丰富的经验。在大数据时代,大数据技术是一种全新的数据分析方法,这两种技术方法都是可以对数据信息进行分析的,并且可以建立一个价值体系。所以,大数据技术和以往的统计学分析的方法是非常相关的,主要体现在两方面的内容。一方面是大数据技术和统计学方法在对事物的规律进行发掘的时候有着一致性的特点,而且都是把概率当做根本,并且还可以对数据信息进行汇总,然后进行观察,从而完成对其分析的工作。

不管是大数据技术,还是以往的统计学分析方法,都是根据数据信息来进行分析的,而且还可以建立一个依据。简单来说就是大数据技术和以往统计学方法最明显相关性就是数据基础,把数据基础作为分析实施的重点,可以了解到更多知识,保证可以对事物进行深入的探索。另一个方面就是大数据技术和以往的统计学方法都是把量化当作根本,大数据技术对数据进行分析的时候,主要的方法就是建立一个体系,然后根据相关的情况制作表格,然后进行分析处理。统计学分析方法就是根据量化进行合理的分析工作,从根本上来对数据进行全面的分析,然后对于每项的特征和情况来制定相关的判定方法,最后进行数据分析工作。
        4.2大数据技术和传统统计学分析法的差异性
        第一,数据不一致,在对大数据技术和以往统计学方法进行比较分析的时候,可以看出,大数据技术可以快速的对数据信息进行分析和整合,特别是对一些特殊的数据,可以对其进行分析处理,降低出现局限性问题的几率。相比于以往的统计学方法,大数据技术在对数据进行管理和分析的时候有着明显的优势。
        大数据技术和以往的统计学分析方法数据信息是不一样的。随着大数据技术的快速发展,全世界每个服务器当中的数据信息都是不一样的,而且数据内容非常的丰富,大量数据信息的获取使数据的应用变得更加方便。不过,在以往统计学方法当中,数据都是使用抽样分析的方法进行的,在数据库当中只有少量的信息,这样也就导致在对数据分析的时,分析的效果有局限性。分析人员使用大数据技术进行操作的时候,可以根据数据的标准和分析方法得到完整的数据信息,然后进行全面的分析工作。大数据技术在精准度方面会比以往的统计学方法好很多。
        第二,分析的方法不一样,在分析大数据技术和传统统计学法差别的时候,可以看出,在以往的统计学当中,分析人员在对数据进行分析的时候一定要将运行的方法和分析方法进行假设,然后使用数据对比的方法来对这个假设进行验证。因此可以看出,以往的统计学方法在对数据进行处理的时候,更加重视对理论内容进行假设和对假设进行验证的工作。要是使用大数据技术,不管是对运行情况还是方法进行分析的时候,都不会使用以往的思维方法,而是建立一个完整额的机制,然后对数据信息进行分析和观察。
        5在线学习分析系统构建
        5.1系统架构
        本文在研究的基础上,结合在线教育大数据的主要数据来源、服务对象、主要功能等,提出在线学习分析系统的系统架构,整个系统架构由在线教育系统、数据预处理、学习分析引擎、显示面板、利益相关者5个模块构成。与传统学习分析系统不同,在线学习分析系统的利益相关者还包括研究者。研究者主要研究学习分析系统本身,如哪些学习分析服务能够在最大程度上帮助学习者管理自身的学习,管理者如何通过新的视图改变教育决策过程,哪些系统特性是学习者、教师、管理者最需要的等问题。
        需要注意的是,在线学习分析系统架构中的各模块并不是孤立存在的,各模块之间存在一定的关联性。根据数据流向可知,前一模块的输出数据作为后一模块的输入数据,整个系统架构形成了一个封闭式的数据流循环,学习者、教师、管理者既是教育数据的生产者,也是教育数据的消费者。教育利益相关者与学习分析系统的交互有效地促进了教育大数据的动态再生。
        5.2技术架构
        在线学习分析系统的技术架构自下而上分为数据采集层、数据存储管理层、分析应用层。
        数据采集层将源数据预处理后传输给数据存储管理层。数据存储管理层将数据存储在数据仓库。分析应用层基于数据仓库实现数据的挖掘、统计、分析,将分析结果通过数据接口进行Web集成与展示,最终为学习者、教师、管理者提供分析应用服务。在整个技术架构中,教育数据的质量监控与安全管理贯穿整体流程,以确保教育数据在每个环节的可控性与安全性。
        5.2.1数据采集层
        与传统教育数据相比,学习分析系统的源数据具有来源多样、数量庞大、格式不统一等特点。数据采集层主要完成源数据的采集和预处理,将源数据经过析取、清洗、转换等一系列ETL处理后传输到数据存储管理层,同时控制接口数据源的获取、转换和加载,以及ETL过程中数据的审核、监控与调度。为了保证数据的正确性,在ETL的每一个环节都必须对数据进行审计。
        5.2.2数据存储管理层
        在线学习分析系统教育数据的存储和管理主要由数据仓库完成。在数据仓库的基础上,对于某些特定主题的学习分析应用,可以对数据进行进一步组织,根据分析主题的需要创建相应的数据集市。还可以根据关键部门、重要领导、分支机构等关心的分析主题、数据粒度、数据层次为其构建数据集市。为频繁访问数据仓库的关键部门建立相应的数据集市,能够提高系统对访问的响应速度,提升系统性能(数据集市的数据直接来自数据仓库)。
        5.3基于大数据的学习支持服务体系构建
        本文构建以学习者为中心,以导学、督学、助学为理念,以大数据为技术手段,构建以资源支持服务、技能支持服务、管理支持服务、交互支持服务和评价支持服务支撑的学习支持服务体系。
        5.3.1大数据环境
        大数据技术使学习支持服务更加个性化、精准化、时效化和智能化。在线学习平台包含结构化数据、非结构化数据和异构化数据,这些数据并不都具有使用价值和自动呈现结论的功能,不能直接为学习支持服务所用。数据价值需要通过收集、筛选、处理和分析过程才能体现。首先,将数据存储在云存储数据中心,并实时更新数据。利用合适的算法对数据进行预处理,对数据进行分析和挖掘,建立基于大数据的效能反馈。然后,对已预处理的数据进行关联、分类、聚类、偏差分析,建立学习者信息库、学习者特征模型、学习知识模型、学习行为模型、学习感知模型、评分数据库,使学习支持服务过程更加精确、个性化和智能化。最后,对数据进行可视化,将数据分析结果呈现,进而为学习者提供优质的个性化学习支持服务。
        5.3.2学习支持服务体系
        (1)资源支持服务。学习资源包括课程资源和信息资源。课程资源承载着本课程的主要内容,是学习对象。信息资源包括与课程相关的拓展资源,以及讨论资源、生成性资源。目前已有爱课程、学堂在线、华文慕课、腾讯课堂、网易云课堂等各具特色的学习平台,这些平台提供大量的学习资源。
        (2)技能支持服务。杜克大学研究表明,许多学习者缺乏必要的预科知识或技能基础,最终未能完成课程学习。在线学习平台不限制学习者背景,学习者的知识层次和能力水平不一,因此,有些学习者面对在线学习平台的功能会感到束手无策。英国开放大学、为在线学习者提供一般性学习技能和核心学习技能两类服务。一般性学习技能指学习课程必备的基本技能,诸如阅读、做笔记、制定学习计划、选择合适的学习策略、信息技术、复习考试等;核心技能如合理分配学习时间、报告交流、在线讨论、解决问题、批判性思维等。
        结语
        本文提出了一个基于Web服务的在线教育数据信息采集系统,可为在线教育数据提供这提供在线收集数据的手段。通过使用Web服务接口,可以在异构计算系统之间进行数据交换。基于XML的架构可实现异构系统的硬件或软件的相融合,将数据上传到网址后,教育数据使用者可以方便地收集数据。
        参考文献
        [1]杨现民,陈世超,唐斯斯.大数据时代区域教育数据网络建设及关键问题探讨[J].电化教育研究,2017,38(1):37-46.
        [2]康世龙.多代理仿真中自适应模型融合研究[J].信息技术与网络安全,2019,38(5):96-100.
        [3]陈国心.在线教育中的数据驱动教学功能及学习效果评价[D].西安:陕西师范大学,2017.
        
       
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: