计竞舟 贺岳星 余瑞丰
国防科技大学信息通信学院,陕西西安,710106
摘要:基于目前我国高等教育统计分析中存在数据更新速度缓慢、数据分析滞后、数据反馈率低等问题,运用大数据思维,将大数据思维与小数据研究相结合,重点关注数据挖掘技术在高等教育统计数据中的运用。对比国内外研究现状,提出我国高校存在对数据挖掘重视度不高、数据挖掘技术在高等教育统计数据中的运用不充分、适应于高等教育教师与学生特点的数据挖掘技术应用欠缺等问题,并提出了解决的方案。
关键词:教育统计;大数据;数据挖掘
一、我国高等教育统计数据分析现状
教育主管部门和各学校力求管理好数据、分析好数据、利用好数据,覆盖采集、统计、分析、诊断、决策等全流程,以便更好地为领导决策服务、为学校发展服务。从拍脑袋决策到用数据说话,统计数据在教育管理中意义重大。但各高校在具体统计过程中,普遍存在机械上报的情况,缺乏适应性微观统计指标设计。同时,对已统计数据缺乏深入分析,大部分仅停留在简单描述和说明上,并未真正发挥统计数据的反馈作用,数据利用率较差。其主要表现在以下几个方面:一是高校的教育统计多数是被动地完成报表任务,数据统计人员多是兼职的,服务方向依然是以为上级服务为主,教育统计仍以搜集整理内部数据为主,未能主动地根据教育管理需要进行采集,把统计与学校工作相结合,把统计信息自觉地用于决策和日常工作。二是目前统计的口径较多,每年度都有高等教育事业统计、教学基本状态数据采集、固定资产投资报表等各级各类报表,上级下达的归口部门不同,时间节点的要求也不一样。这导致学校不同部门给出的数据出入很大,也有学校为了应对检查和评估,捏造数据,使得统计数据失真。三是数据统计之后基本上停留在数据阶段,分析数据、利用数据进行决策的意识和能力很弱【1】。
二、大数据思维导入
简单来说,大数据思维就是把一切可记录的事实都作为数据并从中寻找有价值信息的思维[3]。主要体现在以下四个方面。
第一,非结构化数据也是数据。大数据的数据来源更为多样,相比传统统计学中数据通过简单测量记录的方式采集,大数据的“数据化”方式使得非结构化数据提取成为可能,为更加客观分析反馈结果提供有力支撑。
第二,数据是动态变化的。不同于一次性的静态数据,大数据会因数据更新而发生动态变化。例如,我国每年的教育统计工作会得到大量的数据,但其作为一次性调查,无法实现数据的实时更新和跟踪比较,使得数据分析存在滞后性,无法精确给予政策支持和建议。
第三,数据样本等于数据总体。大数据强调要分析与事物相关的所有数据,增大数据覆盖面,将“假设一验证”转变为“发现一总结”, 实现数据全面汇总,不遗漏个体化特征数据。
第四,数据通过挖掘才有价值【2】。大数据的数据容量大且繁杂,并非所有数据都是有效数据、都能直观呈现出相关性。故需要根据分析目的,运用数据挖掘技术,剔除无用、虚假、错误的数据,从而获取有价值的信息。
三、我国高等教育数据挖掘现状
(一)教育数据挖掘数据挖掘指的是从大量数据中提取出隐含的、具有潜在价值的信息与模式的过程.数据挖掘研究主要分为基础理论研究和应用研究, 基础理论研究的重点是数据挖掘的方法、功能以及系统和软件的建设等,而应用研究则更倾向于成果应用,教育数据挖掘指的就是数据挖掘在教育领域的应用。利用数据挖掘技术,可以使教育领域中的大量原始数据的潜在价值得到有效开发,在理论数据和实践应用中建立紧密联系,实现透过繁杂的数据,提取价值信息,进而合理预测、有针对性地实施决策的良性循环。
(二)基于网络教育系统的特定方法主要包括统计和可视化、Web挖掘,其中, Web挖掘分为文本挖掘,关系规则挖掘和序列模式 挖掘、聚类、分类和偏差检测三组。将教育数据挖掘方法分为预测、聚类、关系挖掘、人类的判断和模式发现等5大类。针对教育数据挖掘的研究,国外的研究方法以及项目反映理论的结构方程模型和贝叶斯网络等的运用,更具有前瞻性和应用价值。
(三)我国高等教育数据挖掘研究应用国外开展数据挖掘研究较早,在高等教育领域逐渐形成“渴望学习”“适应性学习”“希维塔斯 学习”等成熟应用。近年来,我国学者针对高等教育的各个方面正在进行数据挖掘分析的尝试【3】。
四、教育统计数据挖掘与分析方式的思考
目前,国内外部分高校对教育统计数据的挖掘与分析进行了有益的探索,为我们不断完善创新数据统计方法、来源、存储等,为数据的采集、梳理、分析系统化提供了研究基础与实践成果。接下来,高校可以在以下几个方面加强统计数据的研究与实践。一是建立教育大数据人才培养和协同创新中心,发挥好学校教育学、统计学、计算机、管理学、数学等方面的基础和优势,整合优化资源,推进学科交叉融合,加强政校、校企、校校之间的合作,联合打造协同创新平台,开展教育大数据的科学研究以及创新型人才培养。二是充分发挥好数据中心对教育事业的智库作用。借鉴和引进国内外教育大数据研究的方法、成果及经验,充分运用数据挖掘与分析技术,开展针对性强、有前瞻性的数据研究工作,为教育事业发展、学校的办学决策提供参考。三是申报建设教育数据平台,探索教育数据分析研究成果的应用机制和转化机制,围绕教育行业和教育服务周边领域,瞄准行业领域需求,充分发挥研究平台优势,将教育数据研究成果转化为生产力。
五、结语
目前国内关于教育事业统计的研究范围、方法等仍有较大提升空间。首先,目前高校已经认识到大数据对高等教育发展的重要意义,但对于具体的高等教育数据如何挖掘还未高度重视;其次,数据挖掘技术在高等教育统计数据中的运用不充分,在高等教育的诸多领域还未涉及;最后,还未形成适应于高等教育教师与学生特点的推广模式,针对性不强。在我国持续深入推进大数据战略的背景下,我国高等教育数据挖掘分析具有良好的发展前景,其 不仅需要计算机科学、统计学领域的研究者精进技术算法,还需要教育学、心理学等多领域研究者通力合作。立足高校实际,完善专业人才队伍建设,搭建系统化研究平台,充分发挥一线教师、管理人员的作用,为早日形成适应于高等教育数据挖掘分析的系统技术体系奠定坚实基础。
参考文献:
[1]王青逯.健全教育统计职能,服务教育科学发展[J].现代教育科学,2008(6):22—25.
[2]程晶.大数据背景下教育统计数据有效利用的问题与对策—基于高等教育事业基层统计工作的思考[J].价值工程,2017,36(36):182—183.
[3]张志国,薛晓娟.高等学校教育统计存在的问题及对策[J].天津职业技术师范大学学报,2016(2):63-66.
计竞舟,(1988.02-),男,硕士,从事综合信息服务;
贺岳星,(1991.01-),女,学士,从事综合信息服务教学与研究;
余瑞丰,(1990.12-),男,学士,从事综合网络管理。