国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)為基礎,應用為先導

2019-10-30 09:00李維明
中國信息技術(shù)教育 2019年18期
關鍵詞:爬蟲分析法網(wǎng)民

李維明

“數(shù)據(jù)處理與應用”是《普通高中信息技術(shù)課程標準(2017年版)》(簡稱《標準》)“必修模塊1:數(shù)據(jù)與計算”中的重要內(nèi)容之一,主要包括數(shù)據(jù)的采集與整理、分析與應用等幾個方面。在實踐中應當以數(shù)據(jù)為基礎,應用為先導,展開數(shù)據(jù)處理的教學。

● 明確數(shù)據(jù)需求,科學采集與整理

要處理數(shù)據(jù),必須采集數(shù)據(jù)。數(shù)據(jù)的來源渠道眾多,數(shù)據(jù)的類型也多種多樣,我們可以根據(jù)需求進行采集。例如,開展類似“中學生移動學習現(xiàn)狀調(diào)查”活動了解“中學生移動學習的基本情況”,則需要采集學生的“移動設備的使用時間”“移動設備的使用頻率”“常用資源類型”等方面的數(shù)據(jù)。又如,欲了解“哪些因素影響中學生的移動學習”,則需要采集“學生對移動學習的態(tài)度”“家長是否支持”“移動設備擁有情況”等方面的數(shù)據(jù)。只有明確了需求,才能采集到需要的數(shù)據(jù)。教學中必須讓學生明確地了解自己的需求,從而有目的地設計數(shù)據(jù)采集方案。

數(shù)據(jù)的來源通常有紙媒數(shù)據(jù)(如問卷調(diào)查數(shù)據(jù))、傳感器輸入數(shù)據(jù)、網(wǎng)絡、數(shù)據(jù)庫數(shù)據(jù)等。我們必須根據(jù)數(shù)據(jù)的特點及來源途徑,選用合適的方法及工具進行采集。對于紙媒數(shù)據(jù),可以使用人工或掃描的方法將其錄入計算機,從而完成數(shù)據(jù)采集;對于數(shù)據(jù)庫的數(shù)據(jù),由于已有規(guī)律存放,則可以用數(shù)據(jù)庫處理工具進行采集;而對于傳感器采集的數(shù)據(jù),則要根據(jù)傳感器的類型和輸出的方式不同而采用不同的方法采集數(shù)據(jù)。通常情況下,傳感器輸出的是一個電信號,這個電信號值會隨被測量的變化而變化,采集到這些電信號的數(shù)值,就可以研究被測量變化的規(guī)律,從而加以利用。但在實際應用場合,傳感器往往自帶了一個簡單的轉(zhuǎn)換器,將電信號自動轉(zhuǎn)換為數(shù)字信號以方便人們采集應用。例如,機器人中的光敏傳感器在黑色表面時會輸出一個數(shù)值為100的數(shù)字信號,而在白色表面則輸出一個數(shù)值為0的數(shù)字信號,在其他表面則輸出0~100的不同數(shù)值,人們可以通過機器人軟件系統(tǒng)采集這些數(shù)據(jù)作為利用的基礎。

在互聯(lián)網(wǎng)高度發(fā)達的今天,網(wǎng)絡更是信息的海洋。通過網(wǎng)絡獲取數(shù)據(jù)的方法很多,“在線問卷”“搜索引擎”都是其中重要的方法。對于這兩類工具的使用方法,在初中甚至小學都有涉及,不必過多糾纏,更重要的是了解其中原理,如“網(wǎng)絡爬蟲”等?!熬W(wǎng)絡爬蟲”(又被稱為網(wǎng)頁蜘蛛、網(wǎng)絡機器人等),是一種按照一定的規(guī)則,自動地抓取互聯(lián)網(wǎng)信息的程序。由于它可以作為一種工具自動地獲取網(wǎng)頁數(shù)據(jù),因而也就成了不少“搜索引擎”的重要組成部分。從目前使用的教材來看,有關“網(wǎng)絡爬蟲”的內(nèi)容,多數(shù)教材有所涉及,但出現(xiàn)的位置有所不同,有的在“單元3:算法與程序?qū)崿F(xiàn)”學習之前,有的在此之后,所以教學時采用的方法也就迥異。學習“單元3:算法與程序?qū)崿F(xiàn)”之前講“網(wǎng)絡爬蟲”只能略講、定性地了解,而學習之后講則可以用“算法與程序?qū)崿F(xiàn)”“網(wǎng)絡爬蟲”的功能,教學策略完全不一樣。教學時可根據(jù)學生情況及學習進度,靈活地掌握教學尺度,重在講清“網(wǎng)絡爬蟲”特點,而這種特點正是互聯(lián)網(wǎng)條件下解決問題的特有的思維方式和解決辦法,這正是計算思維培育的關鍵之處。

采集到的數(shù)據(jù)需要對其進行簡單的整理,主要是對原始數(shù)據(jù)進行校驗處理,使之系統(tǒng)化、標準化,也就是要對采集的數(shù)據(jù)進行“數(shù)據(jù)清洗”,過濾那些不符合要求的數(shù)據(jù),如不完整數(shù)據(jù)、錯誤值或異常值、重復記錄等,為數(shù)據(jù)的分析處理打好基礎。教學中應當重視這一環(huán)節(jié),讓學生養(yǎng)成規(guī)范處理采集數(shù)據(jù)的習慣。

● 根據(jù)數(shù)據(jù)用途,正確分析與表達

數(shù)據(jù)用途是指我們使用數(shù)據(jù)的目的。一般包括“了解事物現(xiàn)狀”“剖析事物發(fā)展”“預測事物的未來走向”等,與前述“數(shù)據(jù)需求”緊密相關,即用途決定需求,需求決定數(shù)據(jù),數(shù)據(jù)決定用途,“中學生移動學習現(xiàn)狀調(diào)查”就是“了解事物現(xiàn)狀”的一個實例。該實例根據(jù)學校促進移動學習健康發(fā)展的用途,產(chǎn)生出“了解中學生移動學習基本情況”這一需求,采集了學生的“移動設備的使用時間”“移動設備的使用頻率”“常用資源類型”等方面的數(shù)據(jù),運用分析工具即可得出分析結(jié)果,這些結(jié)果決定了“學校促進移動學習健康發(fā)展”的措施的形成。所以,“用途”“需求”“數(shù)據(jù)”既相輔相成又相互制約,在教學中必須明確它們的關系。

如何正確地進行分析,需要根據(jù)數(shù)據(jù)本身的特性,選用適合的工具,采用恰當?shù)姆椒ǘ鵀橹?。常用的分析方法有三類:對比分析法、平均分析法和結(jié)構(gòu)分析法。

對比分析法通常是把兩個相互聯(lián)系的指標數(shù)據(jù)進行比較,從數(shù)量上展示和說明研究對象規(guī)模的大小、水平的高低、速度的快慢,以及各種關系是否協(xié)調(diào)等。例如,需要了解我國網(wǎng)民規(guī)模的發(fā)展,可以使用歷年網(wǎng)民人數(shù)進行對比分析,由此可以明顯地觀察到網(wǎng)民人數(shù)的逐年遞增(如圖1)。

在對比分析中,選擇合適的對比標準是十分關鍵的步驟,選擇合適,才能做出客觀的評價。圖1選取的是同一國家(中國)、同一量值(網(wǎng)民人數(shù)),所以能從數(shù)據(jù)中分析出其發(fā)展變化的程度。

平均分析法是利用平均數(shù)指標來反映某一特征數(shù)據(jù)總體的一般水平,圖2是平均分析法的一個實際案例。從圖2可以看出全國居民人均可支配收入逐年增加,人均消費支出也隨之增加,而同一年內(nèi)居民人均消費的總量始終低于人均可支配收入,說明年年有余。

結(jié)構(gòu)分析法是在統(tǒng)計分組的基礎上,計算各組成部分所占比重,就是將各部分與總體進行對比,以分析事物的內(nèi)部結(jié)構(gòu),了解部分與整體的關系等。圖3就清晰地反映了某時段網(wǎng)民的學歷結(jié)構(gòu)以及各學歷段網(wǎng)民占網(wǎng)民總數(shù)的比例。

需要注意的是,由于結(jié)構(gòu)分析法所分析的是部分與總量的關系,所以各部分之和必須與總量相等。這一點在教學過程中必須注意,而且并不是所有的數(shù)據(jù)都可以使用結(jié)構(gòu)分析法進行分析處理。

從以上案例可以看到,無論是對比分析法、平均分析法還是結(jié)構(gòu)分析法,呈現(xiàn)方式都不是枯燥的數(shù)據(jù),而是使用了圖表,這個過程就是數(shù)據(jù)的可視化表達。數(shù)據(jù)可視化就是借助于圖形化手段,清晰有效地傳達數(shù)據(jù)、溝通信息。

綜上所述,對于本單元的教學,其重點是抓住“數(shù)據(jù)”這條線,“采集”“清洗”“分析”“可視化”,科學采集、正確分析,即可付諸應用。當然,這里僅僅是從其教學內(nèi)容入手進行了粗略的分析,提出了一些相關的建議,但愿對大家有所幫助。至于具體的教學方法及步驟,在本期欄目的相關文章中會有詳細敘述,請各位仔細閱讀。

猜你喜歡
爬蟲分析法網(wǎng)民
基于Python的網(wǎng)絡爬蟲和反爬蟲技術(shù)研究
Python反爬蟲設計
“臺獨聯(lián)署”被島內(nèi)網(wǎng)民嘲
基于層次分析法的智慧城市得分比較
基于層次分析法的智慧城市得分比較
基于Scrapy框架的分布式網(wǎng)絡爬蟲的研究與實現(xiàn)
基于層次分析法的投資性住房選擇模型
基于層次分析法的投資性住房選擇模型
誰搶走了低價機票
電化學發(fā)光分析法測定糖尿病相關二肽
曲水县| 安义县| 吉首市| 凤台县| 左云县| 隆安县| 垣曲县| 宜阳县| 台南县| 汤原县| 灌阳县| 阿坝| 南宫市| 定陶县| 社旗县| 九江市| 榆树市| 庆元县| 克什克腾旗| 新泰市| 通州市| 镇原县| 吉安市| 南开区| 芒康县| 法库县| 镇安县| 鸡西市| 揭西县| 洛扎县| 安吉县| 油尖旺区| 横峰县| 澄城县| 佳木斯市| 老河口市| 柯坪县| 黔南| 张掖市| 比如县| 湖南省|