基于大数据的高校学生校园学习行为分析模型研究

发表时间:2020/9/1   来源:《教育学文摘》2020年11期   作者:杨帅1 薄其波2
[导读] 随着高校信息化建设的不断完善,在校学生日常生活和学习行为被各大业务系统记录和存储下来
        摘要:随着高校信息化建设的不断完善,在校学生日常生活和学习行为被各大业务系统记录和存储下来,并且得到了持续的积累,形成了具有一定规模的学生个人数据。本文从学生基本信息、校园学习、校园生活三个层面对学生数据进行归类总结,重点针对学生学习行为数据进行分析和建立模型,探究学生学习行为的特征。
关键词:大数据;学习行为;模型
1.引言
        大学生是高校教育的主体,对学校教育质量、人才培养、校风建设等方面起着决定性作用。以往,学校主要是通过问卷调查、访谈等方式对学生行为活动进行了解,利用传统方法获取的数据数量有限,时效性受到挑战。随着大数据、物联网、移动互联网等新型信息技术的广泛应用,数字校园、智慧校园等在教育领域如火如荼地进行。其中,大数据作为智慧校园建设的关键支撑技术,对智慧校园建设具有无可替代的作用。
        大数据最早由TOFFELER(2006)在其经典著作《第三次浪潮》中提出。《Nature》在2008年推出Big Data专刊。随着大数据的流行,大数据的定义呈现多样化的趋势,其中三种定义较为重要。属性定义:国际数据中心IDC定义了大数据,指作为新时代的技术和系统,通过对数据的收集、处理及分析来获取其中的价值信息。比较定义:比传统的数据库管理软件具备更强的数据处理能力,是一种更高级的大数据集,此定义由麦肯锡公司给出。美国麻省理工学院的Sam Madden(2012)教授在此基础上,进一步提出大数据具有数据量大、变化快和传统工具难处理的特点。体系定义:从机制角度对大数据进行了分析,其提高了传统方法中的数据处理效率,优化了数据的容量大小、处理速度及方法,此定义由美国NIST给出。
        大数据服务学校管理领域关键在于启发和辅助决策。智慧校园所建设的各类系统数据全部汇聚到大数据交换平台之中,将海量的异构多维校园数据进行接入、共享、分发和挖掘应用。通过大数据综合分析,掌握校园里师生的行为规律和学校的整体运行水平,对学校整体教学科研形式和发展态势整体研判、动态监测,从被动应对到主动服务转型,实现源头发现、智慧服务。
2.学生校园行为分析
        校园行为分析是对学生校园行为数据的分析和挖掘,主要通过统计分析、数据挖掘、机器学习等方法探究各行为数据之间的相互影响,并从行为数据中挖掘
有价值的信息,助力智慧校园建设。
        对于校园行为数据的分析挖掘,按照各研究中对学生行为数据集的选择,进行如下分类:
        (1)单一类别行为数据分析
        单一类别的行为分析包括对论坛数据的分析、校园网行为的分析和一卡通消费数据的分析。
        (2)多类别行为数据分析
        单一类别的行为分析反映的是学生校园生活的某一个“侧面”,多类别行为分析就是将这些“侧面”连接起来,可以全方位地展示学生的行为特征和规律,从中挖掘出更有价值的信息和意义。
3.学生个人大数据分析模型
        高校大学生在校期间所产生的学生行为数据中,不仅包括结构化和非结构化的学习类数据,例如成绩数据、课堂实录数据、线上学习行为日志等,以及体量大、密度高、价值低、品类丰富的生活类数据,例如校园网使用数据和一卡通消费数据中的餐厅消费数据、超市消费数据、校医院就诊数据等,还包括学生基础信息数据如院系、专业、年纪、性别、籍贯等基础信息类数据。学生个人大数据分析模型如下:
        
        
        
        
        
       
        

图1 学生个人大数据分析模型
        该模型包含三个层面即学生基本信息类、在校学习类、校园生活类三个层面对学生数据进行归类、特征提取。学生的基本信息类主要包括学生基本信息即学号、年级、学院、专业、籍贯、民族、性别、出生年月,家庭情况即是否独生子女、家庭经济情况,政治面貌即是否是党员、积极分子或团员及群众。在校学习类包括课程信息、成绩信息、在线学习信息、图书馆信息、实验室信息、科研成果。校园生活类包括一卡通信息数据、校园网使用数据、校园活动数据。本文针对学生的学习行为进行分析,因此对在线学习类数据进行分析建模。
4.在线学习行为分析模型
        在线学习情景下,学生的行为数据一般以课程为单位汇聚,按照传统教学的一般过程可以将其分为课前准备、课中学习、课后讨论、课程考核四大类,从行为科学理论和建构主义学习理论的角度来看,各环节的学生行为表现紧密关联。其中,课前准备环节主要体现在学生对课程的关注度上,一般来说,学生关注某一门课程时,会表现出对课程开课时间、开课通知的关注;课中学习环节,即对在线课程及资源进行学习的过程,主要体现在学生的学习投入度上,具体反映在资源学习时间、资源学习次数、累积学习时间、累积学习次数等行为指标上;课后讨论环节,以论坛访问、发帖、回帖情况作为考量指标;课程考核环节主要是对作业完成情况的表现。
表1 在线学习分析模型
 
5.模型后续处理
        在确定好在线学习分析模型后,后续就需要进行数据分析平台的搭建及大数据的行为分析。当下较为流行的大数据处理框架有Hadoop,Storm,Spark,较为常用的数据分析语言是Python和R。如果对数据处理的实时性要求不高,进行批量离线处理,可选择基于Hadoop框架搭建大数据处理平台。搭建号数据处理平台后,就可筛选有成绩记录的学生在线学习行为数据,对学生的学习行为数据进行清洗、预处理及整体分析。
参考文献
[1]蒋鑫,洪明.国际教育大数据研究的热点、前言和趋势——基于WOS数据库的量化分析[J].中国远程教育,2019(02):26-38.
[2]杨亚,毛海波.图书馆对学生学业成效贡献的大数据分析平台构建[J].宁波大学学报(理工版),2016,29(01):33-36.
[3]邹志洪.一卡通数据中学生消费行为及其成绩相关性研究[D].湖南大学,2018

杨帅:山东交通学院 讲师  薄其波:国家电网济南市供电公司   高级工程师
山东省教育科学“十三五”规划一般课题:基于大数据的高校教学行为和学习行为研究 阶段性成果,课题编号:YC2019358
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: