陳鷗輝
大數(shù)據(jù)是指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
設(shè)計(jì)背景
本教學(xué)案例參考粵教版教材“信息技術(shù)必修1:數(shù)據(jù)與計(jì)算”的第五章《數(shù)據(jù)處理與可視化分析》。具體設(shè)計(jì)課時(shí)分布如圖1所示。
第一次課:數(shù)據(jù)的采集(2課時(shí))
第一節(jié)課,主要向?qū)W生解釋大數(shù)據(jù)的定義及特征,并通過(guò)視頻讓學(xué)生感知大數(shù)據(jù)時(shí)代對(duì)我們生活帶來(lái)的各種影響。例如,播放中國(guó)首部大數(shù)據(jù)產(chǎn)業(yè)題材紀(jì)錄片——《大數(shù)據(jù)時(shí)代》。
第二節(jié)課,通過(guò)對(duì)網(wǎng)頁(yè)數(shù)據(jù)的采集向?qū)W生介紹幾種不同的采集方式。以爬取百度網(wǎng)頁(yè)數(shù)據(jù)為例向?qū)W生介紹最簡(jiǎn)單的采集網(wǎng)頁(yè)數(shù)據(jù)的方式,即沒(méi)有采集限制協(xié)議的網(wǎng)頁(yè)數(shù)據(jù)方式。如果有采集協(xié)議限制,如豆瓣,用上面的爬取方式則無(wú)法爬取到正常的網(wǎng)頁(yè)數(shù)據(jù),需要根據(jù)協(xié)議方式進(jìn)行采集,代碼如圖2所示。
在第二節(jié)課的爬蟲(chóng)實(shí)操中,從簡(jiǎn)單的爬蟲(chóng)代碼過(guò)渡到爬蟲(chóng)協(xié)議,再到實(shí)現(xiàn)豆瓣的數(shù)據(jù)爬取及存儲(chǔ),讓學(xué)生一步步地了解爬蟲(chóng)原理,并能夠應(yīng)用爬蟲(chóng)爬取各種數(shù)據(jù),總的來(lái)說(shuō)學(xué)生的應(yīng)用實(shí)操效果良好,能夠通過(guò)修改代碼完成自己想爬取的網(wǎng)址源代碼并保存。通過(guò)這種體驗(yàn),學(xué)生表現(xiàn)出對(duì)大數(shù)據(jù)的強(qiáng)烈興趣。學(xué)有余力的學(xué)生,還可以加入拓展任務(wù),代碼如圖3所示。
第二次課:數(shù)據(jù)的清洗與保存(2課時(shí))
第一節(jié)課,讓學(xué)生完成代碼,體驗(yàn)清洗網(wǎng)頁(yè)數(shù)據(jù)的方法與過(guò)程(如圖4)。
通過(guò)教學(xué)引導(dǎo),學(xué)生基本上都可以完成補(bǔ)充,具體補(bǔ)充代碼如圖5所示。
完成教師的案例后,可以引導(dǎo)學(xué)生爬取自己感興趣的文章并將數(shù)據(jù)清洗出來(lái)保存到記事本中,以便下一次課進(jìn)行數(shù)據(jù)可視化表達(dá)。作為技術(shù)課程,滿足學(xué)生對(duì)技術(shù)的實(shí)用性體驗(yàn)非常重要,學(xué)生對(duì)這個(gè)案例表現(xiàn)了強(qiáng)烈的操作興趣。同時(shí),教師提供給學(xué)生爬取圖片及視頻保存的代碼,供給學(xué)有余力的學(xué)生進(jìn)行體驗(yàn)。
第二節(jié)課讓學(xué)生體驗(yàn)網(wǎng)頁(yè)的超鏈接數(shù)據(jù)的清洗并保存到表格中(如下頁(yè)圖6)。
通過(guò)教學(xué)引導(dǎo),學(xué)生基本上都可以完成補(bǔ)充,具體補(bǔ)充代碼如下頁(yè)圖7所示。
通過(guò)這個(gè)案例讓學(xué)生明白數(shù)據(jù)是如何關(guān)聯(lián)下載的,有了這些爬取數(shù)據(jù)的方法,教師可以很便捷地快速收集整理出所需要的大量相關(guān)數(shù)據(jù),為下一次課進(jìn)行數(shù)據(jù)可視化表達(dá)做準(zhǔn)備。
第三次課:數(shù)據(jù)的可視化表達(dá)(2課時(shí))
第一節(jié)課主要向?qū)W生講解數(shù)據(jù)分析與可視化表達(dá)呈現(xiàn)的圖表類(lèi)別??紤]到數(shù)據(jù)分析類(lèi)別的實(shí)現(xiàn)比較難以理解,所以數(shù)據(jù)分析主要對(duì)特征探索、關(guān)聯(lián)分析、聚類(lèi)分析等進(jìn)行理論層面的講解,并給學(xué)生呈現(xiàn)出數(shù)據(jù)可視化表達(dá)的多樣性圖示(見(jiàn)教材)。
讓學(xué)生根據(jù)上一次課下載的小說(shuō)進(jìn)行文本可視化操作,代碼如圖8所示。
學(xué)生修改代碼后完成的效果如下頁(yè)圖9所示。
第二節(jié)課,讓學(xué)生從淘寶爬取大量的商品數(shù)據(jù)并進(jìn)行可視化表達(dá),代碼如圖10所示。
運(yùn)行后輸入“手機(jī)”,交流每人的可視化效果圖。
其中補(bǔ)充代碼處為學(xué)生根據(jù)教師引導(dǎo)完成,通過(guò)這個(gè)案例的體驗(yàn)讓學(xué)生對(duì)大數(shù)據(jù)的整個(gè)課程進(jìn)行了回顧總結(jié),既鞏固了學(xué)生對(duì)本章知識(shí)的掌握,又對(duì)之前的知識(shí)進(jìn)行了拓展,讓學(xué)生完整地體驗(yàn)了數(shù)據(jù)從采集、處理到分析及可視化表達(dá)的全過(guò)程,深刻地了解了本章知識(shí)學(xué)習(xí)的成就感及重要性。
另外,如果課時(shí)足夠,還可以引導(dǎo)學(xué)生從國(guó)家統(tǒng)計(jì)局獲取數(shù)據(jù),實(shí)現(xiàn)對(duì)數(shù)據(jù)的動(dòng)態(tài)演示。也可以播放動(dòng)態(tài)可視化效果圖激發(fā)學(xué)生的學(xué)習(xí)興趣,作為拓展作業(yè)讓學(xué)生自己課后探索完成。
點(diǎn) ?評(píng)
高中新課程標(biāo)準(zhǔn)制定專(zhuān)家熊璋教授在一次學(xué)術(shù)報(bào)告中講到“在課程中,我們要讓學(xué)生不僅能只見(jiàn)樹(shù)木,還要能見(jiàn)到森林,還要走進(jìn)森林”。這個(gè)觀點(diǎn),如果體現(xiàn)在數(shù)據(jù)科學(xué)中,就是要進(jìn)行深度的體驗(yàn)與實(shí)踐,不能往常教學(xué)那樣只是讓學(xué)生了解大數(shù)據(jù)概念、知道大數(shù)據(jù)應(yīng)用或者只是體驗(yàn)大數(shù)據(jù)的方便。而是,需要引導(dǎo)學(xué)生從編程的深度,去親身體驗(yàn)如何通過(guò)程序來(lái)研究大數(shù)據(jù),包括如何獲取、如何整理、如何分析與呈現(xiàn)等,陳歐輝老師的這個(gè)專(zhuān)題式整體設(shè)計(jì)正是給我們大數(shù)據(jù)的大單元設(shè)計(jì)的借鑒,直觀、深度且易操作,讓學(xué)生通過(guò)程序的試用、補(bǔ)充、提高,大計(jì)算思維的視角去學(xué)習(xí)數(shù)據(jù)科學(xué),意義重大,值得提倡!
(點(diǎn)評(píng)人:王愛(ài)勝)