网络爬虫在中学地理课程资源建设中的应用研究

发表时间:2021/6/22   来源:《教学与研究》2021年第7期   作者:王荣 李殿奎
[导读] 随着互联网的迅速发展,网络教学资源日益丰富的同时为师生教学提供有利帮助
        王荣   李殿奎
        佳木斯大学 教育科学学院  黑龙江省佳木斯市  154007)
        摘要:随着互联网的迅速发展,网络教学资源日益丰富的同时为师生教学提供有利帮助,但在教学方面存在一些问题,如资源繁杂、分布松散、使用传统的搜索引擎主题相关性不强等,师生较难在大量的资源中高效获取有针对性的内容。本文分析了面对海量的资源,利用网络爬虫技术,以获取中学地理课程网络教学资源为例,使用爬虫软件八爪鱼采集器,高效自动获取网络教学资源,阐述了具体的获取方法,利用信息技术,为中学师生网络数字资源建设提供借鉴的思路。
          关键词:网络爬虫;地理课程;资源建设;网络教学资源
         在教育领域方面,网络教学资源成为师生获得网络教学资源的重要途径,为师生教学提供了丰富的资源宝库。在中学资源建设层面,数字教学资源的建设十分重要。传统的获取数字资源的方式,师生仅靠手工逐一下载,采集效率低,限制了师生教学的使用。教育部印发的《基础教育课程改革纲要》中指出要加强信息技术在教学中的应用,改善师生的教学方式。因此,利用信息技术将网络教学资源高效的应用到中学教学中,是师生日前关心的话题。
一、中学网络教学资源建设现状
         网络教学资源是一种特殊的教学资源[1],广义的网络教学资源是指在网络中具有教育价值所有能用于教学的资源。包括媒体素材、课件、网络课程等[2]。腾欣欣认为由于应试教育的影响、部分教师信息技术素养不能满足现代教学的需求、经验尚浅的限制,使得大多数网络课程资源成为书本内容的拷贝版,缺乏创新,资源类型不丰富,缺乏系统性,更新缓慢,资源共享机制[3]。高海燕认为现有的中学网络教学资源不能满足实际教学的需要,共建共享存在众多问题,不能突出学生的主导地位,重知识传授轻环境因素[4]。田华文认为网络学习支持服务技术尚且不成熟,教师的信息素养有待提高,资源少内容单一,资金有限都是制约中学网络教学资源不能充分利用的原因[5]。
二、网络爬虫概述
         (一)网络爬虫
         网络爬虫是一种依据一定规则自动获取网页信息的程序[6]。通过机器代替人工,自动获取互联网页面信息,免去人工手动的复制粘贴,网络爬虫在网络数字资源获取中具有重要价值,如单位时间采集数据量大,数据获取效率较高等[7]。
         网络爬虫技术应用广泛。例如,通过网络爬虫获取海量数据并分析数据背后的潜在信息,为特定行业提供服务,一些商品价格的对比,热点新闻的采集等。随着网络爬虫技术的发展,网络爬虫在教育领域的应用逐步深入,例如机器学习算法需要丰富的数据,因此较为依赖网络爬虫技术来获取数据。
         (二)网络爬虫在中学网络教学资源建设中的可行性
         网络爬虫具有很多优势,虽然在基础教育领域领域应用较少,但在中学网络教学资源建设中具有可行性。首先,爬取的结果针对性强。师生较为习惯传统的搜索引擎进行关键字搜索,但是会存在一些问题,比如。搜索结果主题相关性不强,广告、无关内容掺杂其中[8],内容重复等。网络爬虫可以弥补这些不足,可以定向采集针对性较强的网络教学资源。采集方式不同,既可以通过编程来实现,也可以通过现有的网络爬虫工具,本文选用网络爬虫软件八爪鱼采集器,实现数据采集。其次,大量获取有价值的数据。通常师生在有限学习的时间内获取的网络教学资源很有限,大大的限制了师生的教学资源的利用,网络爬虫能够用技术改善传统方式一一下载的费时操作,用机器语言代替手工操作,轻松的获取大量的网络数字资源,可以实时更新,教学效率得以大大提升。
三、网络教学资源在中学教学中的优势
         利用网络教学资源为课堂教学填充丰富多彩的内容,成为日前学校教学的一大趋势,网络数字资源具有众多优势,满足现在课堂的教学需求。体现在以下几个方面。
         网络教学资源增进感官刺激,促进重难点的理解。知识借助视频、音频、图片等网络数字资源的感官刺激,以生动的图形、声音,促进重难点的理解。面对抽象的知识,学生通常难以直观思考,通过图片等网络教学资源将抽象的知识形象化的呈现,辅助学生建立具体的思维方式,对重难点的突破十分有益。例如:在高中地理中图版必修2第一章第一节《人口增长模式》一节中,用“1949年以来我国历年人口自然变动情况”折线图来表示人口变动的状况,帮助学生记忆中国人口增长状况这一教学重点。
         网络教学资源直观展示知识,为教学资源做有益补充。在实际教学中,经常出现难以身临其境的观察知识的现象,图片等网络教学资源直观展示知识,为教学带来了极大的便利。另外,在教学资源方面,网络教学资源为文字做出了补充,使得教师可利用资源增多,增进了课堂的教学内容。例如:地理学科需要培养学生的空间感,仅凭借语言和文字无法展示地理的空间感,因此,图文并茂是一种有效的教学方式,借助图片辅助教学,成为不错的选择。
         网络教学资源激发学生的学习兴趣。《新课程标准》要求在教学实践中,凸显学生的主体地位。教师只有在教学方法等方面不断创新,学生的学习兴趣才得以激发。图片等网络教学资源弥补了语言和文字表达的枯燥,利用网络教学资源在教学的各个环节中烘托气氛,增进了课堂的吸引力和感染力,以生动的表现形式激发了学生的学习兴趣。例如:在讲解“世界的自然资源”这一章节中,教师用“小鸟的悲哀”图片进行情境导入,让学生从同情小鸟的遭遇中体会保护自然资源的重要性。
四、地理课程网络图片采集的实现
         根据网络教学资源在教学中的优势,以及网络爬虫在资源获取方面的优势,因此,将网络爬虫应用到中学地理课程的资源建设方面具有一定的可行性,本文选用发展较为成熟的第三方软件“八爪鱼采集器”,作为资源爬取工具。八爪鱼采集器可以在抓取数据的过程中过滤掉与当次采集无关的数据。性能良好,运行稳定,实现资源的顺利获取。
         (一)采集工具的简介
         八爪鱼采集器是一款网络数据采集软件,无需代码编辑,无需人工搜索,软件即可随时实现大量数据采集,并将采集数据保存到计算机中。免费数据采集功能即可满足师生图片获取需求,成本低,图片获取效率高。使用八爪鱼采集器的模板采集过程,以采集百度图片为例,如图1所示。


         (二)采集图片的具体步骤
         1.打开登陆八爪鱼客户端
         在八爪鱼官方网站(https://www.bazhuayu.com/)免费下载v8版本,保存在计算机中,需注册方可登陆。主界面主要分为4大区域,分别是导航条、输入网址栏、热门采集模板区、教程区。热门采集模板区域包含多种采集模板,每种模板都针对特定网站,用途不尽相同,有的模板功能免费,有的则收费。
         2.百度模板采集实例
         (1)设置采集参数
         百度图片为免费版,成本低,是图片较为丰富教学图片库,适宜中学师生选用。本文以百度图片模板为例,采集初中地理七年级上册《地球和地球仪》一课中的相关图片为例,以“地球和地球仪”为关键词,设置下拉滚动次数为6,即可采集100条左右的数据。
         (2)启动采集
         八爪鱼采集器任务运行分为三种,分别是启动本地采集、启动云采集、启动定时采集,本文选用启动本地采集。采集过程无需人员看管,自动获取图片,历时1分55秒,共采集图片65条,如图2所示。


         由此可见,通过八爪鱼采集器获取网络资源,操作简单,师生不存在软件操作上的障碍。采集效率较高、耗时短、速度快,师生可以直接利用保存到本地的图片,采集网络数字资源可以满足师生教学的直接使用。教师可以使用图片用来备课,学生通过生动形象的图片更容易的掌握《地球和地球仪》一课的教学重难点。
五、使用爬虫软件采集网络教学资源的关键
         (一)选择合适的信息源网站
         网络教学资源分布在不同的网站,为了教学获取良好的资源,应选用资源丰富、运行良好的信息源网站,这样才能保证采集资源的质量[9]。
         (二)熟练操作网络爬虫软件
         了解所选的网络爬虫软件的功能,根据要采集网络教学资源的类型确定采集方式和规则,结合需求的数据量,确保要采集数据的完整性。
六、总结
         本文阐述了中学网络教学资源建设现状,分析了网络爬虫技术在中学网络教学资源建设中的可行性,以及网络教学资源在中学教学中的优势,最后,以八爪鱼采集器为例,通过一定步骤,实现了省时省力获取到地理课程网络图片资源的数据采集,为中学师生数字资源建设拓展思路。八爪鱼采集器能够采集多种网络教学资源,如图片、视频、音频、文本等,满足师生教学的多种需求。尽管如此,用八爪鱼采集器百度模板采集图片存在一些局限:一是滚动次数建议在100以内,因为超过100次滚动次数,系统容易出现采集错误。二是设置的关键词的范围是1至10000,获取的图片种类的数量有限。本文仅利用爬虫软件八爪鱼采集器在图片采集方面进行实践,还可以使用编程方式实现更多类型的网络教学资源的获取。
         教育应顺应科技的发展而与时俱进,利用信息技术建设教学资源,为师生提供更多彩的数字资源,将会是信息技术不断努力的方向。相信通过教育工作者的不断努力,在不久的将来,会建立出专门适合中学师生使用的网络资源库,满足师生更加高效利用网络教育资源,使得中学课堂教学更加丰富多彩。
         
         
参考文献:
[1]Peter Ingwersen.The calculation of Web impact factors. Journal of Documentation,1998,54(2):236-243.
[2]房小敏. 基于Web数据的中小学网络教学资源建设现状调查[D].南京师范大学,2016.
[3]腾欣欣. 国内中小学网络课程资源现状及原因分析[J]. 中国教育技术装备,2004(09):20-22.
[4]高海燕. 中小学网络教学资源建设现状与策略研究[J]. 中国科技信息,2009(21):87+102.
[5]田华文. 中小学网络教学资源利用之我见[J]. 产业与科技论坛,2010,9(02):197-198.
[6]罗刚,王振东.自己动手写网络爬虫[M].北京:清华大学出版社,2010:24-36.
[7](美)Jeffrey E.F.Friedl.Mastering regular expressions [ M ] .O'Reilly,2007:14-37.
[8]李奇涛,管佳.网络信息采集技术在教育领域的应用研究[J].科技创新导报,2014,11(22):114-115.
[9]聂文苗.基于网络爬虫的教师信息技术能力提升研究[J].中国教育信息化,2019(04):71-73.



作者简介:王荣(1990-),女,汉族,黑龙江省萝北县人,在读硕士研究生,研究方向:智能获取及数据可视化技术在教育领域的应用研究。

通讯作者:李殿奎(1964-),男,黑龙江齐齐哈尔人,教授,硕士研究生导师,研究方向:教育信息资源建设。
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: