借鉴新加坡科技设计大学,探索课程间融合 ——以大数据专业《概率论与数理统计》课程为例

发表时间:2020/9/21   来源:《中国教师》2020年12期   作者:陶明珠
[导读] 当下,传统课程教学设计思路很难适应当前应用型人才
        陶明珠
        安徽信息工程学院通识教育与外国语学院  安徽芜湖 241000

        摘要:当下,传统课程教学设计思路很难适应当前应用型人才的培养的需要,尤其是计算机类、大数据类[1]等实践性很强的专业,部分通识类课程在教学设计中依旧采用传统的方法和思路,其内容很难和后续专业课程相衔接和融合,导致课程知识的实际应用不足。另外,我国高等教育教学设计方面,远落后于欧美大学,因此,以安徽信息工程学院为例,围绕大数据专业的人才培养需要,借鉴其成功经验,探索基于多学科融合的课程教学改革,探索课程的主题知识树及课程间的关联性。
        关键词:概率论与数理统计,大数据,课程融合
一、面临的问题
        (一)课程教学呈现孤岛,课程间衔接性不强。对于本文所所涉及的概率论与数理统计(以下简称“概率统计”)课程,为全校各专业都开设的一门通识课,不仅涉及的面广,而且是许多专业后续课程的基础,是数学基础课程中应用性较强的课程。但是传统课程教学多注重知识讲授和理解,课程考核多以知识点掌握为主,学生对其在后续专业学习中的作用不明确,课程结束后,课程也逐渐被遗忘。
        (二)传统课程教学多以知识传授为主,学生对其和后续课程关联的认识不足。从概率统计课程本身来说,它是一门研究随机现象的科学,它的思想方法与学生以前接触过的任何一门学科均不相同,学生在学习过程中需要改变以往数学课的思考方式,因此概率统计一直是学生认为比较困难的课程。对于大数据专业的学生来说,该门课程中很多知识点在数据分析和处理中得到非常大的应用,而传统课程教学中却没有体现,导致学生在学习时获得感不强,认为课程学习对后续专业学习没有作用。
        (三)传统知识点较多,重点应用型较强的知识点不清晰。由于传统的数学教育属于知识传授型,比较注重课程各自的系统性、独立性和方法的应用,人为地割裂了数学理论和数学方法与现实世界的联系,使得学生在学完该课后只知道几个抽象分布,甚至最简单的数据处理方法都不会应用[2]。
二、国内外借鉴
        我国十八届五中全会“十三五”规划提出,“实施国家大数据战略,推进数据资源开放共享”,“运用大数据技术,提高经济运行信息及时性和准确性”,各个行业主管部门都出台了相关的大数据政策,如何利用大数据更好地为生产、生活服务,已经成为各个行业亟待解决的问题。当前大数据应用型人才的培养尚处于初级阶段[2],课程体系不成熟,人才培养过程存在一定阻力,目前很多高校开展人才培养的探索,不管从课程设置上,还是从课程教学上,逐步培养学生的“大数据思维”,培养学生利用大数据思维[1]解决工程问题的能力,从而让学生适应当前大数据的快速发展。对于多学科课程间的渗透和融合,国外的很多高校也进行了实践,新加坡科技设计大学打破了“传统学科专业的壁垒”,构建了多学科的交叉复合人才培养方案;英国伦敦大学学院将多数或所有工科学生聚在一起的多学科体验,让学生参与一系列多学科交叉符合的项目和模块课程。
三、《概率论与数理统计》课程教学设计
(一)重构传统教学内容设计
(1)大数据专业人才培养目标
        以安徽信息工程学院数据科学与大数据技术专业为例,本专业致力于培养符合国家战略及安徽省大数据产业发展需求,具备一定的数理基础及扎实的编程基础,以及大数据基础知识与技能,熟练掌握大数据采集、预处理、存储、处理、分析、应用技术,能够运用大数据思维、模型和工具解决实际问题的高素质应用型人才。
        本专业学生毕业后可从事大数据挖掘、数据分析、研发、测试、运维和管理等工作。本专业的培养目标可以划分为以下4个子目标:
        目标1:适应新经济发展需要,爱国进取,全面发展与健康个性和谐统一,具有职业道德和社会责任感。
        目标2:具备较好的数理基础,熟练掌握数据挖掘、分析、建模等原理及工具使用,进而能对多种数据源进行数据挖掘、深度分析、数据建模及有效评估,并能向行业提供有效的分析报告,为行业运营决策提供数据支持。
        目标3:具有较强的数据思维、AI思维以及基本工程素养,具有智能软件开发实践能力和技术创新能力,能够独立地完成大数据分析系统的开发与设计,能够在设计、生产中担任组织管理角色。
        目标4:具有团队精神、组织沟通能力和国际视野,能够继续学习,终身学习的能力。
        围绕着本专业人才培养的需要,本门课程教学以培养学生的大数据素养,让学生懂得大数据的基本理念和基本处理方法。
(2)课程内容梳理,重构课程教学设计
        从概率统计课程来说,主要内容为概率统计的基本概念、随机变量及其概率分布、数字特征、大数定律与中心极限定理、统计量及其概率分布、参数估计和假设检验、回归分析、方差分析、马尔科夫链等。在课程的教学改革中,结合数据科学与大数据技术专业的培养目标,围绕数据分析能力要求,结合课程知识点在数据分析中的关联性,梳理课程知识内容及重难点,重构课程教学设计。
(二)融合大数据分析知识点,构建符合大数据专业的课程知识树
        1、梳理课程知识点,构建课程知识树


        2、概率论与数理统计知识的应用——以贝叶斯方法为例[3]
        (1)贝叶斯定理知识介绍
        在概率统计课程当中,贝叶斯定理是第一章中条件概率的相关知识,具体为:关于随机事件A和B的条件概率(或边缘概率)的定理。其中P(A|B)是在B发生的情况下A发生的可能性。
        (2)贝叶斯方法的常见应用场景


        实际数据分析与处理过程中,贝叶斯理论应用比较广泛,如:文本分类、垃圾文本过滤、情感判别、多分类实时预测等,另外,在推荐系统中,朴素贝叶斯和协同过滤(Collaborative Filtering)是比较好的使用形式,协同过滤是强相关性,但是泛化能力略弱,朴素贝叶斯和协同过滤搭配,能增强推荐的覆盖度和效果。
        (3)贝叶斯方法应用案例——检测SNS社区中不真实账号(分类)
        下面围绕使用朴素贝叶斯分类解决实际问题的例子进行说明,如何通过课程教学中使用贝叶斯理论完成数据分类。
        问题描述:对于SNS社区来说,不真实账号(使用虚假身份或用户的小号)是一个普遍存在的问题,作为SNS社区的运营商,希望可以检测出这些不真实账号,从而在一些运营分析报告中避免这些账号的干扰,亦可加强对SNS社区的了解与监管。
        如果通过纯人工检测,需要耗费大量的人力,效率也十分低下,如能引入自动检测机制,必将大大提升工作效率。简而言之,该类问题为将社区中所有账号在真实账号和不真实账号两个类别上进行分类,接下来将通过具体的案例分析流程,让学生熟悉贝叶斯方法在实际应用场景中的应用。
        假设:C=0表示真实账号,C=1表示不真实账号。
        1)确定特征属性及划分
        区分真实账号与不真实账号的特征属性,在实际应用中,特征属性的数量是很多的,本案例选择三个特征属性:a1:日志数量/注册天数,a2:好友数量/注册天数,a3:是否使用真实头像。在SNS社区中这三项都是可以直接从SNS系统数据库里得到或计算出来的。下面给出划分:a1:{a<=0.05, 0.05<a<0.2, a>=0.2},a2:{a<=0.1, 0.1<a<0.8, a>=0.8},a3:{a=0(不是),a=1(是)}。
        2)获取训练样本
        通过运维人员曾经人工检测过的1万个账号作为训练样本(确保数据的可靠性)。
        3)计算训练样本中每个类别的频率
        用训练样本中真实账号和不真实账号数量分别除以一万,得到:
        
       
        
        5)使用分类器进行鉴别
        使用上面训练得到的分类器鉴别一个账号,这个账号使用非真实头像,日志数量与注册天数的比率为0.1,好友数与注册天数的比率为0.2。
        通过计算,认定为真实头像的概率为0.00198,没有使用真实头像的概率为0.063,可以看到,虽然这个用户没有使用真实头像,但是通过分类器的鉴别,更倾向于将此账号归为真实账号。这个例子也展示了如果特征属性充分多时,朴素贝叶斯分类对个别属性的抗干扰性较强。
        (4)后续课程改革思路
        以上通过数据分类案例,讲解贝叶斯理论在数据分类中的应用,因此后续课程改革中将梳理出课程的主要知识点构建主题知识树并设计相应的教学案例,主要围绕如下两点开展课程教学改革:
        1)课程拟采用该模式进行教学实施,但是对数据分析的技术体系的认识依旧不足,后续将和专业课老师建立联系,逐步完善和优化课程教学内容设计;
        2)目前虽然设计应用场景案例用于教学,但是在软件的使用上未对学生进行要求,对于分析结果的解释性,学生学习起来依旧存在困难,后续将围绕相关软件或工具,配合课程教学实施。
四、小结
        在当前数据大爆炸的时代,大数据已经上升为国家战略,要求每个大学生都要领会一定的数据分析理念,懂得一定的数据分析技术,“概率论与数理统计”作为一门在大学中广泛开设且主要研究数据分析技术的课程,我们需要在其强化数据分析技术的讲解,强调“用”的培养,需要进一步探索如何开展课程间融合,结合专业课逐步完善课程教学设计。
参考文献
[1]赖巧玲,李梅,任丽洁.大数据背景下数理统计课程的教学改革与实践[J].科教文汇(中旬刊),2019,(01):66-68.
[2]李晓莎,武洪萍.基于大数据背景下应用技术型高校概率论与数理统计教学改革的研究与实践[J].中国石油大学胜利学院学报,2019,33(02):65-67.
[3]刘娟,胡桂武.人工智能思维利器——贝叶斯公式的教学探究[J].教育教学论坛,2019,(38):141-143.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: