陈效玉
(鲁东大学教师教育学院 山东烟台 264000)
[摘要]在线学习的快速发展,产生了大量的在线学习数据,这些数据是学习者学习过程与结果的重要体现,因此对于数据的获取与分析则尤为重要。目前对于数据的分析用到最多的几种方法包括:回归分析、机器学习、结构方程等。在目前几种分析方法的基础上,伴随着教育与技术的不断融合,对于在线学习数据中的建模技术的发展也将会有新的趋势。
[关键词]在线学习;建模技术;数据分析
伴随着“终身教育”理念的落地,越来越多的人使用网络教学平台进行不断学习,网络教学平台以时间随意、资源丰富、方便快捷等优点受到越来越多人的青睐,学习者可以在讨论区大胆发表自己的看法,可以通过弹幕吐槽老师的教学;教学者可以通过学习者的留言、弹幕、作业完成情况、登录平台次数、持续在线时间等因素,获得学生学习的第一手数据,并且能够根据学生的学习情况及时调整自己的教学策略,以便更好地改进自己的教和学生的学。
在线学习平台凭借它独特的优势,得到了快速发展,由此,在线学习中产生了大量的数据,这些数据是学习者学习过程和学习结果的体现,因此对于数据的获取与分析尤为重要。研究者先前较多使用后台数据直接获取的方式,这样的方式需要人为的进行处理并且耗费一定的时间,目前越来越多的人采用爬虫技术来进行数据的获取,并且能够对所获取的数据进行简单的处理,节省了大量的时间。将所获得数据进行分析并且建立模型,对学习者的后续学习过程提供了很大的帮助,但是使用什么样的技术进行建模是关键问题,因此本篇文章主要对在线学习数据中的建模技术进行综述。
在对学习交互背景下所产生的大规模数据进行建模时,多采用回归分析、结构方程、机器学习等不同的技术方法,其中回归分析占大部分。
(一)回归分析
回归分析是一种属于统计学的方法,它能够确定变量之间的相互依赖的变量关系,最常用于预测。回归分析的方式有多种,比如线性回归、逻辑回归、多项式回归、岭回归等等。教育研究者使用回归分析来预测学习者的成绩或者探求学习影响因素与成绩之间的相互关系。例如,宗阳等人详细论述了逻辑回归建模的流程,并且针对中国大学MOOC中的一门课程数据进行处理,按照逻辑回归建模的流程,对影响学习者成绩的因素进聚类,建立成绩预测模型,依据此模型得出实验结论:应用逻辑回归可较有效地预测学习效果,提交作业测试是预测MOOCs学习成绩的关键指标[[[] MOOCs学习行为与学习效果的逻辑回归分析]]。在线学习为学习者带来了极大的便利,也能够让教师掌握学生的学习数据,但是伴随着在线学习的发展,其中情感交互的缺失问题越来越明显,教师与学习者之间缺少情感的互动,也难以实现成功的交互。为探究学习者的学习兴趣与学习成绩之间的相互关系,刘智等人提出了基于情感—主题时序建模的学习者兴趣主题挖掘方法,利用该方法计算概率值,进行学习兴趣与成绩之间的回归分析,从而探究兴趣主题对学习效果的影响在课程进展中有何演化趋势[[[] SPOC论坛中学习者兴趣主题建模及其与学习成效的关系研究]]。胡艺龄等人[[[]在线学习行为分析建模及挖掘]]通过对学习者对于电子课本的使用数据,使用聚类和回归算法建立自变量与因变量之间的关系模型。冯晓英[[[]学习者在线学习水平的学习分析模型_省略_临场感学习分析模型构建与方法探索]]则是将相关分析、岭回归、多元线性回归相结合,以此来提高模型的准确性和可解释性。
使用回归分析技术进行建模在国内外的应用都比较多,它能够动态反映因变量与结果之间的相互关系,有利于研究者掌握探究因素与结果的相关性,运用数据提高实验的可靠性。
(二)机器学习
伴随着人工智能技术的快速发展,以机器学习和深度学习技术为建模方法的研究也越来越多,机器学习的建模方法不仅能够处理大规模的数据并且能够进行自动编码,有效避免了人工编码所带来的误差,所以越来越受人们的青睐。机器学习算法包括有:朴素贝叶斯、随机森林、决策树、支持向量机、K邻近等等。其原理各不相同,其中朴素贝叶斯算法以概率论中的贝叶斯公式为基础,探究先验条件满足的情况下后验条件所出现的概率;决策树算法的基础是一棵决策树,能够根据该树的结构,沿着各个分支判断,直至叶子结点,即最后结果所属的类别;支持向量机是一种二分类算法,以统计学为基础,它的分类依据是找到一个最优分类超平面。为了预测学生的最终学习成绩,陈子健等人[[[]基于教育数据挖掘的在线学习者学业成绩预测建模研究]]在建立成绩预测模型之前,首先计算信息增益率来判断影响学习成绩的因素有哪些,之后运算多种机器学习算法进行学习成绩预测模型的构建,比较几种算法模型的准确率。孙发勤等人[[[]基于学习分析的在线学业成就影响因素研究]]在探究在线学习中影响学习者的成绩的因素时,采用机器学习中的决策树算法进行建模分析,并且使用统计学中的回归分析和深度学习中的神经网络进行建模分析,比较这三种算法的准确度并且选取决策树算法作为最后的分析算法进行预测,该研究发现最大影响学业成绩的包括学习的态度、投入的水平和及时的水平。
(三)结构方程
在线学习一般发生在虚拟社区中,其中虚拟社区中的社会性交互尤其需要重视,它关系到知识交流与同伴互助。在探究虚拟学习社区中影响社会性交互的影响因素时,陈为东等人[[[]学术虚拟社区用户社会性交互的影响因素模型与优化策略研究]]使用问卷等形式获取用户交互数据,利用结构方程模型进行数据的处理,从而得出影响学习交互的影响因素,以及各个因素对学习交互的具体影响程度。朱彩凤[[[]混合学习环境中主动性人格和人际交互与学习绩效的关系研究
]]认为交互的程度在一定程度上反映了一个人的主动性人格的高低,所在她对主动性人格、交互程度影响学习者的成就进行探究,使用社会网络分析法对学习者的交互关系进行分析,使用结构方程模型进行影响程度的计算,从而得出主动性人格和交互影响呈正比,并且二者也会在一定程度上影响学习者的成绩。
在线学习和大数据技术的快速发展,越来越多的研究者开始对教育的数据进行深入的分析,以此来探求教育发展规律,以便及时的改进教学。对教育数据进行研究时,大多都会用到建模技术,例如上文提到的结构方程、回归分析、机器学习等等。在未来的教育数据挖掘中,将会进行更深度的研究,那么技术的发展也尤为重要。1、回归分析、结构方程这些传统技术会一直沿用,虽然当今技术的发展速度很快,也不乏一些前沿高端的算法,但是在研究的过程中还是需要考虑到普适性,并不是所有的技术都能进行教育数据的挖掘,成熟的算法或许可以结合一些新的技术进行融合,既能够赶上时代的潮流,又能使算法的效果很好,具有针对性。2、深度学习、神经网络的发展应该重视,神经网络作为一种新的技术,其精确度高,鲁棒性强等特点,逐渐被人们使用,现在由于算法较为复杂,大多用在计算机等前沿学科,在教育领域的应用还较少,在以后的教育数据挖掘中,应该多进行神经网络等算法的尝试,尤其是教育情感的发掘。
本篇文章是对在线学习数据分析的建模技术进行论述,首先介绍在线学习的发展以及应用,在线学习中产生的大量的数据需要进行分析挖掘,所以引入建模技术,详细论述了数据分析建模中常用到的回归分析、结构方程、机器学习技术,并列举了一些国内外的建模实例。最后对建模技术在教育领域的发展趋势进行了思考,提出自己的想法,在数据爆炸的时代,数据分析、建模技术一定会成为教育工作者越来越重视的一环。