高校数据科学的实验室建设研究

发表时间:2020/12/8   来源:《教育学文摘》2020年8月第24期   作者:张聪
[导读] 大数据技术与应用发展前景广阔,如何在新形势下设置人才培养目标,
       张聪
        哈尔滨信息工程学院 大数据分析实验室,黑龙江 哈尔滨 150025
                
        [摘要]大数据技术与应用发展前景广阔,如何在新形势下设置人才培养目标,培养出能够掌握该专业相关技术和跨界实践的合格人才,实现专业的可持续发展,是目前必须考虑的首要问题。高校数据科的实验室建设与管理在大数据教学中起着至关重要的作用。
        [关键词]数据科学;实验室
        
        
        近年来,随着数据应用越来越广泛,世界各地的政府、银行、电信公司、互联网以及电子商务等相关机构,都在使用大数据相关技术, 数据正变得越来越有价值,大数据受到我国政府的高度重视和大力支持, 2015年8月31日,国务院印发《促进大数据发展行动纲要》(国发〔2015〕50号),标志着将大数据纳入国家战略层面。根据国家统计局公布的《战略新兴产业分类(2018)》,大数据是我国重点发展的战略新兴产业中新一代信息技术产业的细分行业之一。来自教育部官方数据:2018年,教育部首批认定612个新工科研究与实践项目,探索建立“新工科”建设的新理念、新标准、新模式、新方法、新技术、新文化。然而目前大部分高校缺乏大数据技术专业人才和数据科学实验室建设经验,也对国家实施大数据发展战略也带来了较大的挑战。
        一、建设背景
        什么是大数据?《Science》杂志在大数据专刊中这样定义:代表着人类认知过程的进步,数据集的规模是无法在可容忍的时间内用目前的技术、方法和理论去获取、管理、处理的数据。可以看出,大数据不仅是指数据规模大,更重要的是如何从这些动态或静态的数据流或数据中获得具有可利用和挖掘价值的信息。人们对于海量数据的挖掘和运用预示着新一轮生产率增长和消费者盈余浪潮的到来,由此产生大数据工程师的岗位。大数据工程师就是一群“玩数据”的人,玩出数据的商业价值,让数据变成生产力。重视数据的机构已经越来越多,上到国防部,下到互联网创业公司、金融机构需要通过大数据项目来做创新驱动,需要数据分析或处理岗位也很多;常见的食品制造、零售电商、医疗制造、交通检测等也需要数据分析与处理,如优化库存,降低成本,预测需求等。[1-3]
        大数据在全球经济竞争和科技发展中占有举足轻重的地位。因此,高职院校必须紧跟当前科技的发展步伐,进行大数据检测与收集、大数据存储与处理等方面人才的培养,以技能型人才的需求为导向,以实验室建设和管理为中心,大力培养大数据应用技术专业技能型人才,满足支撑社会经济发展的大数据岗位所急需的紧缺性人才需求。
        二、建设目标
        大数据学科方向是一门交叉专业方向,与不同专业相结合可以发展成特定方向的专业或研究领域。经济金融、应用数学、统计学、计算机科学等传统专业方向与大数据学科方向相结合表现出多样化的差异特征,包括专业研究方向与社会需求岗位在内。除了课堂学习,通过实验来加深理解和提高实际应用操作能力也是主要途径。调查表明,当前大数据涉及到很多内容,如数据分析、数据挖掘、数据可视化等,其中的很多实验,都无法在我国高校现有的实验室中完成。因此,建设专门的大数据实验室就显得非常重要。
        大数据实验室全面落实“产、学、研、用”一体化的思路和模式,从教学、实践、科研和使用多方面注重专业人才和特色人才的培养。

能够从大数据需求和发展的角度规划和建设大数据实验室,真正在产业、学校、科研及实践项目中相互配合,发展优势,形成生产、学习、科学研究、实践运用的系统运作模式,从而建设大数据特色专业。
        实验室建设紧密结合教学、实训、实战和专项工程化实践,不仅能够提升学生的动手实践能力,还可以提高学校中青年教师工程化实践项目实践实验经验的积累。实验的项目管理实践,让教师在项目实践过程中能够全面积累项目实施经验,同时,学生也能够真正将学到的知识用于实际的生产环境中,弥补学校专业培养和市场人才需求的缝隙,做到人才培养和就业需求的无缝衔接。
        三、建设内容
        大数据指的是所涉及的数据量规模巨大到无法利用目前主流软件工具,在合理时间内达到采集、管理、处理、并整理成为帮助企业经营决策更积极目的的数据信息。大数据实验教学包含平台搭建、数据获取、数据处理、模型建立、数据分析、模型优化、可视化等部分的内容。学生首先要掌握搭建的方法与技巧,其次掌握数据挖掘的基本理论与算法,接着要掌握大数据处理的框架与平台,进而掌握针对大数据的数据分析方法,最后选择适用的数据库进行数据存储管理。因此本实验室建设主要内容包括平台搭建安装、数据挖掘、数据存储、模型建立与优化、数据分析与可视化实验。同时,还包括了基础语言类和基础系统类等基础类实验内容,为学生在学习大数据之前做好基础知识铺垫。通过对基本环境的部署和配置文件的修改,掌握接下来对数据进行挖掘与分析的原理。通过该类实验使得学生能够完成对于大数据分析平台的安装与搭建工作并具有Hadoop、Spark件的运行维护能力。数据挖掘部分的实验包括基本实验与算法实验两部分。基本实验用于给学生建立起数据挖掘的基本概念,展示常用的数据挖掘算法。以典型的应用数据为例,展示常用算法的分析效果。算法实验为学生提供编程框架,针对重要的数据挖掘算法进行实现。该部分实验以R语言、Python、SAS为开发环境,学生通过本实验室将掌握数据挖掘主要算法的实现方法。
        数据分析实验包括基本的大数据分析平台与算法实验以及典型实战数据分析实验两部分。大数据分析平台与算法实验包括平台配置与典型算法设计两大类,通过该类实验使得学生能够完成对于大数据分析平台的配置与初始化工作并具有基本MapReduce算法开发能力。典型实战数据分析实验,让学生利用真实的行业数据,完成大数据挖掘与分析,掌握数据挖掘与大数据分析的一般流程。
        根据应用型人才培养目标定位,提高实践教学在人才培养方案中所占的比例,紧跟数据行业技术发展,侧重培养大数据技术的实际操作与大数据项目的实战与应用,比如云平台的搭建优化与维护网络数据爬取,数据的清洗与处理,基础的数据可视化。优化实践教学内容和课程体系,加强实践教学过程监控,更新实践教学评价机制,构建一个层次明确、渐进式的大数据实践教学体系。大数据是交叉学科,走的是“复合型”培养路线,需要了解和掌握的知识较广,综合学科需要掌握金融大数据分析、健康医疗数据分析、交通物流数据分析等行业领域相关知识。
        总之大数据目前在国内还处于初级阶段,但是其商业价值已经显现出来,特别是有实践经验的大数据分析人才更是各企业争夺的热门。为了满足日益增长的大数据分析人才需求。高校在数据科学实验室教学环节通过引导学习者的实践活动,从而传承实践知识,形成技能,发展实践能力,提高综合素质的教学活动。围绕着学科建设的各个方面,从专业开设、课程设置、师资培养、教学资源、实验环境、学生实训实习及就业创业等环节,提供完整的产品体系,满足高校学科建设及人才培养不同阶段的需要。
        [参考文献]
        [1]刘凤娟 . 大数据的教育应用研究综述[J].软件导刊(教育技术),2014卷(G40-057):47-51
        [2] 胡铁生.微课、慕课的建设误区与房展建议[D]南京:南京农业大学,2014
        [3]郑怡文,陈红星,白云晖.基于大数据在课堂教学中对学生精准关注的实验研究[J].现代教育科学,2016,(2):54-57.

[作者简介]张聪(1988-),男,黑龙江哈尔滨人,讲师,学士,从事数据科学研究。
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: