伴随式教育档案管理数据及其评价功能

发表时间:2020/8/12   来源:《文化时代》2020年7期   作者:王天珍
[导读] 信息技术的迅速发展和学校教育管理工作电子化为教育评价改革带来了契机,电子学籍档案系统的建立及基于这个平台自动生成的伴随式教育管理过程数据具有全员入样和动态跟踪的性质,它为更加精准地评估学生发展、教师绩效、学校效能、政策效果等提供了基础。
云南省昭通市档案馆
        摘要:信息技术的迅速发展和学校教育管理工作电子化为教育评价改革带来了契机,电子学籍档案系统的建立及基于这个平台自动生成的伴随式教育管理过程数据具有全员入样和动态跟踪的性质,它为更加精准地评估学生发展、教师绩效、学校效能、政策效果等提供了基础。
        关键词:电子学籍档案;伴随式管理过程数据;教育评价
        引言
        “善于运用互联网技术和信息化手段开展工作”是十九大报告对公共事业管理提出的时代要求。在数字化平台建设和信息化管理服务全面辐射学校等企事业单位的背景下,将日常教育管理工作中自动生成的伴随式管理过程数据(adfministra -tivedata)用于评估学生发展状态、教师教学绩效及其所在学校组织效能或教育政策效果等是教育治理与改进工作的重要内容。实际上,这种数据建设和应用分析的工作思路在工业界和企业界也受到了高度重视,信息技术领域的研究者也关注了类似的数据采集与分析技术对教学诊断、学习心理与行为干预等方面的价值。近年来,各部委的若干政策文本中均体现了充分利用信息化手段改善公共事务治理水平的要求。具体到教育领域,《中小学学生学籍信息化管理基本信息规范》(教基厅[2007]10号)提出了与公安部人口信息管理系统和国家人口基础信息库整合、根据学生身份信息建立全国统一联网的中小学生电子学籍系统的设想,该系统于2014年1月 10日联网试运行成功,预期可“拓展应用于事业规划、经费使用、招生就学、控辍保学、教材管理、考勤评价、社会实践等校内外相关管理”,为教育评价与治理提供数据基础。2015年8月31日,国务院《关于印发促进大数据发展行动纲要的通知》(国发[2015]50 号)肯定了电子学籍系统的重要价值。2016月7,教育部颁布的《教育信息化“十三五”规划》(教技[2016号)将基础数据伴随式收集和全国互通共享的国家教育管理信息化战略工作规划进行了细化。全员全过程管理数据的伴随式收集为教育评价和政策评估奠定了基础,但如何整合并利用这种全样本大规模数据仍是一个需要理论与技术指导的问题。本研究将教育信息化、管理精细化、技术精准化等工作的工具价值统合到评价与治理中,从理论层面分析整合多部门宽时段追踪型档案数据对改进我国教育评价实践的重要价值,也从技术层面讨论处理这类特殊数据的操作步骤。
        一、伴随式数据的集成
        用可靠的高质量数据说正确的话是当前经济和社会各领域评估工作的诉求。如前所述,在“信息化”和“大数据”时代,教育日常管理工作中自然产生的数据富含各类信息,它“大”而“厚”的数据结构所享有的分析技术优势能大幅度地缩减评价或评估中的误差方差比例,从而更真实地反映学生的学习曲线、教师的教学水平、学校的培养质量、政策的实际效果。
        根据《国家教育管理信息系统建设总体方案》中关于“两级建设、五级应用”数据库建设要求,学籍档案覆盖了学生和教职工基本信息等微观个体数据、学校资产及办学条件等中观数据、县级或地市级以及省级的经费收支等宏观数据。理论上,学籍管理系统所采集的动态多期信息可包罗教育生产过程内外的任何事件。例如,学生个人和家庭基本信息、学校及其所在社区的基本情况、各科任课
        教师的背景信息和履历及其所教学生每次考试成绩等所有档案。此外,学者还可通过有意识地设定识别码的方式将自行收集的调查数据、社会实验数据等与学籍档案库进行合并。在公共数据库建设制度成熟的挪威、瑞典、法国、意大利、美国等国家,教育系统的伴随式档案管理数据还可以与劳动和社会保障、医疗卫生、财政与税收、保险、军役服务等终生各项社会记录跨库合并。而且,这些数据对评估个人和组织的长期发展、公共政策执行效果等方面都起到了重要作用。
        由于个人身份代码或若干个体共享的组织机构代码以及地区行政编码等识别码的唯一性,所有数据表均可以通过它得以集成归档。识别码虽然不用于实质性的统计分析,但它对数据整合工作尤其重要,而锚定一个终身不变且便于识计的识别码却成为现实中数据管理与规划工作的难点之一。如果数据表中缺乏具有唯一性和关联性的识别码,即使大量信息都被存储下来,学生与他所在的学校、教他的任课教师及这些教师开设的课程也无法对应起来,这样无法匹配的凌乱数据仍然无助于推进评价工作。
        通过个人、组织和地区等各层面的固定匹配代码,分散在任课教师、教务处、学校财务处、人事处、招生和就业或升学处、区县教育局等多个部门的数据可以横向合并。而且,由于识别码不随时间而变,不同时点上的观测值又可以纵向合并。因此,这符合国务院《关于印发促进大数据发展行动纲要的通知》(国发[2015]50号)工作部署的要求:“完善教育管理公共服务平台,推动教育基础数据的伴随式收集和全国互通共享。建立各阶段适龄入学人口基础数据库、学生基础数据库和终身电子学籍档案,实现学生学籍档案在不同教育阶段的纵向贯通。”
        数据管理和分析中心工作人员只需将这些零散的后台数据直接导出,再以识别码为数据网络节点(node)做合并和转置处理就可以形成基于同一个体或组织的广统计口径宽时间窗口的面板数据。此外,即使只有单期截面数据,这种分科目同时采集学生和教师等相关主体信息的数据也可通过重新编码和纵向转置技术转换成同一学生在同一时点上的多次观测数据,这就是经济学文献中常用的伪面板数据(pseudo-panel)。
        实际上,我国人文社会科学文献中常见的县级、地市级或省级面板数据也是利用这种思路集成的伴随式管理数据,只是其分析单位和加总级别较高而已。在这种同时记录了时间差异和截面差异的面板数据中,某些基本信息不随时间变化(例如,性别、出生时间或地点等)或在同等间隔的时间区间内所有个体发生等量变化(例如,年龄、工作年限等);而另外一些信息随着记录时间的不同而发生不同变化。这种数据结构方面的优势为后文所涉的分析技术提供了统计学基础。
        伴随式档案管理数据至少具有以下几个方面的突出优势:第一,在不同时点上频繁观测各项指标所形成的(伪)面板数据具有统计上的优良属性,可适用于固定效应(fixed effect,FE)等高级计量方法获得更加精准的估计,便于更科学地评估学生发展、教师绩效、学校效能以及政策效果等。第二,可以根据归属关系或业务关系将若干个源数据主体进行精确匹配,形成信息量丰富的“厚数据”,以备更加充分地控制协变量的混淆效应、减少遗漏变量偏误。第三,各源数据主体间存在交叉匹配的可能,可应用更加精致的方法获得最优无偏一致估计。

例如,师生业务关系配对记录中可能存在同一学生选修不同教师的若干门课程的情况或同一学生同时选修同一位教师多门课程的情况,在这种情况下,可以进一步引入“教师-课程”、“教师-学生”、“学生-课程”等高维固定效应,可更加彻底地消除影响学业表现水平的个人能力、人格个性、教师评分标准或教务及课程政策变迁等各主体间的相互选择效应。
        二、伴随式数据的应用价值
        在数据开放度较高的欧美地区,包括教育在内的社会公共事务评估研究中广泛地启用了行政管理过程中产生的伴随式数据 。例如,美国北卡罗纳州几十年的教育管理档案数据存放在杜克大学;佛罗里达、华盛顿、德克萨斯、纽约、芝加哥、丹佛等地的数据频繁地出现在美国教育评估文献中。普林斯顿大学还成立了“国家教育追踪数据分析中心”。截至目前,出于信息安全等方面的考虑,国内伴随式管理过程数据总体上尚未用于教育评价,只有少数学者在部分地区或个别学校开展了个案研究 。我国行政管理过程数据的垄断与封闭现象不仅限于教育领域,经济学家也表达了类似的呼吁。然而,从意识到行政管理数据在评价方面的优越性到普遍投入使用需要经历一个认识过程,即使在数据开放度较高的美国,部分地区早期也受到类似问题的困扰,学者掀起的“数据质量运动”(data quality campaign)缓慢而艰难地改变了美国数据封存和浪费状况。
        (一)评价个体或组织
        在数据不充分或信息缺乏有效整合的情况下,我国教育评价方式也相对粗糙,至少存在以下两个方面的问题。
        第一,数据所有者缺乏共建共享与集成优化意识。即使很多学校或地区很早就启动了无纸化自动办公系统的建设并通过这个信息平台采集了充足的信息,但这些数据散落在科任教师、教务处、招生办和就业指导处、区县教育行政管理部门等。这可能反映了数据处理技术和能力、信息保密的多重限制。笔者认为,即使在短期内无法实现行政管理数据大范围地联网使用,各学校或地区也可以先行先试,做好数据收集规划方案并使这些伴随式数据服务于教育评价与治理工作。第二,数据的利用水平不足,分析技术简单粗糙。很多评价还停留在报告频数(或优秀率、及格率)和均值等描述统计量的初级阶段,增值评估没反映到对学生、教师和培养单位的考核中。用达标率和均值等指标评价教师绩效或学校效能的做法是“一次性”终结性评价,斩断了过去与现在的内在联系,遗漏了公式中的重要内容。这种做法有失公允,引起了很多教师和校长等一线教育工作者的不满,甚至挫伤了一些生源较差的学校的办学积极性或教师的工作积极性。在班级或学校甚至地区等更高层级的分析单元上做横向比较时,更有必要诉诸增值评价理念与技术。在实验示范班级或生源占绝对优势的学校,学生可轻易达到更高的绝对水平,但这些学生最终表现并不一定是学校和教师的作用。从增值的角度看,优生群体甚至还可能存在负增值的退化过程;相反,在生源较差的班级或薄弱学校,尽管学生的绝对表现水平较低,但他们可能已远超出预期可达到的水平。后一种情况所描述的教育过程有效地促进了学生成长,符合“投入 - 产出”的逻辑,但得不到现行评价制度的认可。这正是很多生源较差但效能较高学校面临的困惑。中小学校长和区县教育行政管理部门工作人员也意识到了上述问题,他们很想知道如何做好学生学业评价和教师绩效激励等问题的顶层设计和技术改进。本文中关于数据采集方式的变更及这种信息的合成处理与分析可以从技术上解决他们的忧虑,因此,充分利用教育管理信息化过程中自动生成的伴随式管理过程数据是推动我国教育评价与治理工作的一个立足点。与此同时,较好地落实本研究的研究设想对负责评价的相关工作人员提出了新的专业要求,他们需要加强数统知识修炼或积极寻求与同时谙熟评价理论与计量分析的学者的合作。
        (二)评估公共政策
        政策分析和项目评估常用面板数据进行研究。除了用于评估个人和组织外,学籍档案管理系统生成的伴随式过程性数据还能用于构造前后测“准实验”,并用于评估教育政策效果或其他事件的干预随式管理过程数据“先知先觉”地自动记录了政策生效前的“前测”情况,不必采取要求被访者“回溯”的方式获取干预前的信息,利用双重差分估计等类型的研究设计优势更突出。当前我国很多公共政策评估的文献均是以县或地市以及省为分析单位展开的分析,这些加总到更高行政单元的数据为了解公共政策的执行效果之概貌提供了重要信息,但政策成效及其作用的微观机制还有待更加细致地分析,而档案管理工作能在更基础的观测单元获取数据,对详尽了解公共政策的作用方式、分布效应等问题都具有重要价值。
        三、 结语
        持续性地跟踪人在教育教学常态情境中留下的历时痕迹,有意识地规划数据生成、归档、建模、分析与应用,这项工作能服务于学生成长与发展、教师教学与考核、学校治理与改进、公共政策运行与调整。本研究探讨了电子学籍档案系统生成的伴随式数据对日常教育评价和教育政策评估等方面的潜在价值。在管理电子化和办公自动化的今天,档案资料管理过程中伴随式生成的数据具有完整、追踪等诸多优势。以学生和教师的个人身份代码、学校组织代码、地区行政编码等为识别变量将跨期信息合并成宽厚的数据后,研究者能采用更灵活的模型设定和更精准的分析技术,动态评估学生、教师、学校或公共政策等;在信息量充足的情况下,研究者还可以结合财务数据进行“成本 - 收益”分析,监测公共教育资源的使用效率等。综上,文中所涉的数据构造与应用技术对改进信息收集、资料分析和呈现方式以及提高教育评价精度等方面具有重要价值。而且,评价过程和结果均数有先后、进退有据,经得起反复检验,预期能提高教育治理的精细化水平。受篇幅限制,本研究仅从理论层面讨论了伴随式管理数据的应用价值,而没有提供基于数据的实证分析。
        参考文献:
        [1]C.Zhu,“BigData as a Governance Mechanism,”Review of Financial Studies,vol.32, no.5,2019,pp.2021 -2061 ;刘强、秦 泗 钊:《过 程 工 业 大 数 据 建 模 研 究 展望》,《自动化学报》 2016第2 期;汪寿阳、洪永淼、霍红、方颖、陈海强:《大数据时代下计量经济学若干重要发展方向》,《中国科学基金》2019年第 4期。
        [2]卢国庆、谢魁、张文超、刘清堂、张妮、梅镭:《面向即时数据采集的经验取样法:应用、价值与展望》,《电化教育研究》2019年第6期;余胜泉、徐刘杰:《大数据时代的教育计算实验研究》,《电化教育研究》 2019年第1期;罗玮、罗教讲:《新计算社会学:大数据时代的社会学研究》,《社会学研究》2015年第3期。
        [3]刘亚亚、曲婉、冯海红:《中国大数据政策体系演化研究》,《科研管理》2019年第5期。
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: