唐小勇 吳帆
【摘要】新工科建設(shè)是當(dāng)前新經(jīng)濟(jì)背景下對高校工科人才培養(yǎng)體系提出的新挑戰(zhàn)。本文以Python大數(shù)據(jù)分析及應(yīng)用課程為研究,提出適合創(chuàng)新創(chuàng)業(yè)能力培養(yǎng)為核心的課程知識體系,希望能為新工科建設(shè)提供一種實踐參考。
【關(guān)鍵詞】新工科 ?知識體系 ?大數(shù)據(jù)分析
【中圖分類號】G64 【文獻(xiàn)標(biāo)識碼】A 【文章編號】2095-3089(2018)40-0231-01
一、新工科是工科教育發(fā)展的必然
近年來,隨著以新業(yè)態(tài)、新技術(shù)、新產(chǎn)業(yè)、新模式為主要特征的四新經(jīng)濟(jì)迅猛發(fā)展,給傳統(tǒng)工科教育帶來了全新挑戰(zhàn)。傳統(tǒng)工科教育因過分強調(diào)其工程性,而忽視理科與人文藝術(shù)教育,使學(xué)生缺乏創(chuàng)新能力。其次,傳統(tǒng)工科因思觀念守舊性和學(xué)科偏細(xì)而缺乏對交叉學(xué)科為核心新經(jīng)濟(jì)的敏感性。因而很難適應(yīng)新的社會經(jīng)濟(jì)生活,亟需新的工科教育教學(xué)理念來培養(yǎng)具有創(chuàng)新能力的新興工程科技人才。基于此,教育部于2017年6月在北京召開新工科研究與實踐專家組成立暨第一次工作會議,全面啟動、系統(tǒng)部署新工科建設(shè),目的是為深化工程教育改革,推進(jìn)新工科的建設(shè)與發(fā)展[1]。因而研究適合新經(jīng)濟(jì)的工科課程知識體系是當(dāng)前新工科建設(shè)的重要內(nèi)容。
二、Python大數(shù)據(jù)分析及應(yīng)用課程
大數(shù)據(jù)是當(dāng)前社會經(jīng)濟(jì)生活領(lǐng)域最熱門話題之一,也是新工科人才必須了解的一門新興課程,對于工科工程技術(shù)人才交叉學(xué)科應(yīng)用具有重要的實用價值。然而,大數(shù)據(jù)知識涉及相當(dāng)廣泛,教授什么知識以培養(yǎng)學(xué)生大數(shù)據(jù)分析及應(yīng)用能力去適應(yīng)新經(jīng)濟(jì)是當(dāng)前新工科教育工作者面臨的重要課題[2]。大數(shù)據(jù)分析課程知識相當(dāng)廣泛,包括大數(shù)據(jù)概念、數(shù)據(jù)來源、數(shù)據(jù)處理基本過程、大數(shù)據(jù)特點和應(yīng)用等多領(lǐng)域;同時還有大量的大數(shù)據(jù)具體應(yīng)用系統(tǒng),如數(shù)據(jù)查詢分析計算系統(tǒng)包括HBase、Shark、Hive、Hana、Cassandra;批處理系統(tǒng)Hadoop、Spark;流式計算系統(tǒng)Scribe、Storm、Flume、S4、Spark Streaming等。
作為工科而言,學(xué)科具有很大的差異性,因而所需掌握的大數(shù)據(jù)分析及能力也區(qū)別較大。本文將以軟件工程學(xué)科為例,分析在新工科背景下需要哪些大數(shù)據(jù)知識點。由于面向軟件工程學(xué)科,本文將主要針對當(dāng)前大數(shù)據(jù)分析最重要的編程語言Python進(jìn)行分析,以提出適合新工科的Python大數(shù)據(jù)分析及應(yīng)用課程知識體系,為新工科建設(shè)提供一種思路。
三、面向新工科的課程知識體系
新工科要求課程知識體系要有利于培養(yǎng)學(xué)生創(chuàng)新能力,能適應(yīng)新經(jīng)濟(jì)形式下的工程實現(xiàn)與項目創(chuàng)新能力。因而Python大數(shù)據(jù)分析及應(yīng)用課程首先將系統(tǒng)介紹大數(shù)據(jù)概念、數(shù)據(jù)來源、數(shù)據(jù)處理基本過程、大數(shù)據(jù)特點和應(yīng)用領(lǐng)域。重點在于大數(shù)據(jù)是隨著社會信息大量涌現(xiàn)而出現(xiàn)的一門技術(shù),這種技術(shù)的人創(chuàng)新性如何,與現(xiàn)有技術(shù)的區(qū)別與聯(lián)系。因而要求學(xué)生明確大數(shù)據(jù)與云計算、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、數(shù)據(jù)庫等技術(shù)的相互關(guān)系,了解大數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)特點及價值所在。以此創(chuàng)新為大數(shù)據(jù)分析而不是傳統(tǒng)的數(shù)據(jù)挖掘、數(shù)據(jù)倉庫技術(shù)。
其次,由于大數(shù)據(jù)是種新知識、新技術(shù)發(fā)展的課題,為給學(xué)生直觀了解其技術(shù)體系,課程將介紹具體的大數(shù)據(jù)分析關(guān)鍵技術(shù)如存儲系統(tǒng)BigTable、文件系統(tǒng)Colossus、搜索索引系統(tǒng)Caffeine、查詢工具BigQuery等。要求重點在于這些系統(tǒng)提出來的背景、技術(shù)特點及創(chuàng)新解決的問題,從而讓學(xué)生掌握大數(shù)據(jù)知識體系的應(yīng)用概況。因而課程將引入Python語言來開發(fā)大數(shù)據(jù)實際系統(tǒng),要求學(xué)生掌握這些系統(tǒng)所處的平臺。為此課程將系統(tǒng)平臺基礎(chǔ)知識向?qū)W生展示,這些平臺基礎(chǔ)包括常見的Linux操作系統(tǒng)命令、Docker客戶端和服務(wù)器、Docker鏡像、Registry、Docker容器、Docker安裝與啟動、Docker鏡像操作等。要求學(xué)生掌握平臺部署與維護(hù)能力。
第3部分課程將以Python程序設(shè)計語言的學(xué)習(xí)為重點。但由于學(xué)生已經(jīng)具備基本程序設(shè)計能力,因而將簡要介紹Python語言與其語言不同的基礎(chǔ)知識,如Python安裝、Python表達(dá)式、變量、語句、函數(shù)、 模塊、列表、元組、字符串、字典等相關(guān)概念。然后,課程知識將進(jìn)入Python高級主題,包括文件、抽象、魔法方法、異常、屬性、迭代器等知識。
課程第4部分將是Python如何存儲數(shù)據(jù),因而將介紹大數(shù)據(jù)數(shù)據(jù)庫。由于大數(shù)據(jù)系統(tǒng)的開放性、數(shù)據(jù)的非結(jié)構(gòu)化性,課程采用開源數(shù)據(jù)SQL 數(shù)據(jù)庫引擎SQLite和PySQLite數(shù)據(jù)庫技術(shù)。其次,大數(shù)據(jù)分析是網(wǎng)絡(luò)發(fā)展的產(chǎn)物,因而將需要大量網(wǎng)絡(luò)編程模塊及網(wǎng)絡(luò)編程技術(shù)。所以課程將重點介紹Python socket、urllib和 urllib2等基于網(wǎng)絡(luò)的編程實現(xiàn)技術(shù)。海量數(shù)據(jù)處理將涉及大規(guī)模事務(wù)處理,課程也把Python多線程編程技術(shù)作為重要的知識點,以期能提出學(xué)生進(jìn)行大數(shù)據(jù)處理的能力。
第5部分課程將以綜合實踐應(yīng)用能力培養(yǎng)為目標(biāo),重點在于培養(yǎng)學(xué)生創(chuàng)新項目設(shè)計與實現(xiàn)能力。因而課程主要介紹Python爬蟲基本概念,包括網(wǎng)絡(luò)爬蟲概念、XPath語法、XML解析、Python re、json模塊、HTTP協(xié)議和分布式爬蟲原理等。以此為基礎(chǔ),實現(xiàn)一個影評信息實爬例,包括網(wǎng)頁下載器、網(wǎng)頁解析器、數(shù)據(jù)存儲器、爬蟲調(diào)度器等Python編碼與實現(xiàn)?;谝陨夏芰Γ髮W(xué)生們分組實現(xiàn)基于某團(tuán)購網(wǎng)的大型離線電商數(shù)據(jù)分析平臺、大數(shù)據(jù)分析在媒體公關(guān)與危機(jī)處理方面應(yīng)用、期貨金融大數(shù)據(jù)分析等綜合實踐應(yīng)用大數(shù)據(jù)技術(shù)案例。以此培養(yǎng)學(xué)生在新經(jīng)濟(jì)環(huán)境中的創(chuàng)新創(chuàng)業(yè)能力。
四、小結(jié)
本文針對新經(jīng)濟(jì)背景下的新工科課程知識體建設(shè),提出Python大數(shù)據(jù)分析及應(yīng)用課程的知識體系,系能為新工科建設(shè)提供一定的實踐參考。
參考文獻(xiàn):
[1]https://baike.baidu.com/item/%E6%96%B0%E5%B7%A5%E7%A7%91/20597803?fr=aladdin
[2]祝夫文,段園培,朱協(xié)彬.學(xué)時縮減背景下基于大數(shù)據(jù)的本科教育課時優(yōu)化.教育教學(xué)論壇,2018,(12):89-90
作者簡介:
唐小勇(1973.3-),男,湖南洞口人,副教授,博士,主要研究方向:計算機(jī)教學(xué)法、高性能計算。