潘鐵軍
什么是信息可視化?
由于在線教育的迅猛發(fā)展,信息可視化在最近的幾年中取得了快速的增長(zhǎng),該學(xué)科起源于20世紀(jì)80年代后期,當(dāng)時(shí)的目的是使用計(jì)算機(jī)進(jìn)行人機(jī)交互、圖像顯示,以加強(qiáng)對(duì)數(shù)據(jù)具體特征的理解。在關(guān)于信息可視化的眾多定義中,大家比較接受的是Card等人提出的定義:信息可視化(IV)就是“通過計(jì)算機(jī)的支持與交互作用,將抽象的數(shù)據(jù)進(jìn)行可視化描述以增強(qiáng)認(rèn)知”。根據(jù)這個(gè)定義,有四項(xiàng)內(nèi)容是理解這一領(lǐng)域的關(guān)鍵:可視化描述、交互作用、抽象數(shù)據(jù)、認(rèn)知增強(qiáng)。
1.可視化描述
在現(xiàn)實(shí)中,我們常常試圖通過使用圖形來理解一些現(xiàn)象和數(shù)據(jù),如當(dāng)人們需要尋找城市中的一條街道、了解股票市場(chǎng)在某一時(shí)期的走勢(shì)、查看天氣預(yù)報(bào)時(shí),此時(shí)使用圖形要比使用文字更容易讓人理解。例如,圖1中顯示了一列數(shù)字和一些長(zhǎng)條,這些長(zhǎng)條的長(zhǎng)度與左邊對(duì)應(yīng)的數(shù)字成正比例,假設(shè)我們要找到數(shù)字中的最大值和最小值,如果沒有右側(cè)的長(zhǎng)條,我們就要耗費(fèi)更多的時(shí)間才能得出結(jié)論。
與文字或表格相比,數(shù)據(jù)的圖形化顯示利用了人的視覺感官優(yōu)勢(shì),感官有著強(qiáng)大的能量,它可以將大量的信息傳遞到我們的頭腦中,使我們能夠辨識(shí)出重要的特征,并做出重要的推斷。
2.交互作用
目前,性能優(yōu)越、價(jià)格低廉的圖形計(jì)算機(jī)已經(jīng)普及,通用個(gè)人計(jì)算機(jī)已全面進(jìn)入了圖像化時(shí)代。同時(shí),急劇膨脹的日?;顒?dòng)信息需要人們?nèi)ヌ幚?,這就需要科學(xué)家利用使用者與算法交互的可能性來探索在計(jì)算機(jī)上顯示海量數(shù)據(jù)的新方式。
3.抽象數(shù)據(jù)
數(shù)據(jù)本身可以有多種形式,但我們只能辨別出具有物理對(duì)應(yīng)關(guān)系的數(shù)據(jù),如空氣的濕度、黃金的密度等,除了這些還存在著具有抽象性質(zhì)的數(shù)據(jù),如股票市場(chǎng)的波動(dòng)、未來7天的氣溫走勢(shì)。我們也希望可以用圖像的方式對(duì)這些抽象的數(shù)據(jù)進(jìn)行直接觀測(cè),這樣的需求就促使了信息可視化的產(chǎn)生,其顯著特點(diǎn)是處理非結(jié)構(gòu)化的數(shù)據(jù)集。
4.認(rèn)知增強(qiáng)
圖形可以以多種方式輔助思考與理解。例如,我們進(jìn)行37×73這一乘法運(yùn)算時(shí),心算比使用紙筆計(jì)算的時(shí)間要長(zhǎng)5倍,這一操作的困難在于需要在記憶中暫存兩個(gè)數(shù)相乘的部分結(jié)果直到它們被使用(如圖2)。
這個(gè)例子顯示出可視化手段或工具對(duì)認(rèn)知能力的增強(qiáng),它向我們頭腦中傳遞信息,并使我們搜尋與之匹配的模式,識(shí)別出它與數(shù)據(jù)之間的關(guān)聯(lián),從而更容易地進(jìn)行推斷。
信息可視化的優(yōu)勢(shì)
信息可視化的基本原理就是將數(shù)據(jù)以圖形的形式進(jìn)行展示,并利用人的感官能力對(duì)其進(jìn)行解讀。圖形展示可以幫助我們對(duì)復(fù)雜龐大的數(shù)據(jù)集進(jìn)行描述和理解,正如Larkin和Simon在他們的開創(chuàng)性論文《一圖抵千言》中所說,圖形展示的這種效果是因?yàn)樗鼈兙哂辛己玫目臻g清晰度,基于這個(gè)空間清晰度,再對(duì)數(shù)據(jù)進(jìn)行良好的圖形化展示,這就能提高人們理解內(nèi)容的效率。Larkin和Simon對(duì)比了物理問題中使用圖表計(jì)算和語句計(jì)算的效率,認(rèn)為圖表在以下三個(gè)基本方面具有優(yōu)勢(shì):①通過將要使用的信息聚集在一起實(shí)現(xiàn)了信息定位;②通過使用信息定位將單一元素的信息編組實(shí)現(xiàn)了標(biāo)簽最小化;③通過支持大量的、人們易于接受的感知推理來實(shí)現(xiàn)感知強(qiáng)化。這不僅避免了對(duì)不同信息的大量搜尋,還可以將需要同時(shí)處理的不同的信息緊密地定位在一起。例如,圖3描繪的是馬德里地鐵運(yùn)輸系統(tǒng)的局部線路圖,通過將地鐵線路和站名放在同一張地圖中實(shí)現(xiàn)了信息定位原理的應(yīng)用,乘客可以在圖中方便地查找到線路、交匯、站點(diǎn)等信息。如果一位乘客想要從San Bernardo出發(fā)到達(dá)Cristal,他可以找到多種不同的換乘線路組合,而且能夠大致確定哪條換乘線路組合用時(shí)最短。
信息可視化中的一個(gè)關(guān)鍵問題是我們?nèi)绾螌⒊橄髷?shù)據(jù)轉(zhuǎn)化為圖形,這個(gè)圖形既要保留基本數(shù)據(jù)的意義,同時(shí)還要有新的觀點(diǎn)。研究者對(duì)原始數(shù)據(jù)進(jìn)行圖形化構(gòu)建,在這一過程中沒有萬能公式可用,因此,面對(duì)不同的數(shù)據(jù)性質(zhì)、不同的信息類型,圖形化展示的設(shè)計(jì)者需要更多地發(fā)揮自己的創(chuàng)造力。
教育軟件中的可視化
在網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)上應(yīng)用圖形展示可以幫助教師了解學(xué)生的狀況,同時(shí)可以監(jiān)測(cè)學(xué)生的行為。下面,我們將對(duì)兩種類型的應(yīng)用,即用戶模型的可視化、學(xué)生行蹤數(shù)據(jù)的可視化展開介紹。
1.用戶模型的可視化
用戶模型是對(duì)一組用戶信息集合的描述,其中特別關(guān)注他們?cè)诓煌I(lǐng)域的知識(shí)、學(xué)習(xí)動(dòng)機(jī)及興趣偏好等。學(xué)生模型是智能教育系統(tǒng)中的關(guān)鍵元素,它用來描述學(xué)生對(duì)教學(xué)材料的了解程度。目前,在教育系統(tǒng)中開發(fā)了許多為用戶建模的方法,開發(fā)的這些模型增進(jìn)了軟件的個(gè)性化,尤其是在網(wǎng)絡(luò)上,用戶模型是用來生成個(gè)性化網(wǎng)站的一組信息集合。下面介紹一種用戶模型的可視化工具——E-KERMIT。
KERMIT是一種基于知識(shí)的智能關(guān)系建模指導(dǎo)系統(tǒng),它的功能是為大學(xué)生教授概念數(shù)據(jù)庫(kù)的設(shè)計(jì)。KERMIT以“提出需求-完成需求”的方式進(jìn)行教學(xué),它首先向?qū)W生展示出對(duì)數(shù)據(jù)庫(kù)的需求,然后學(xué)生根據(jù)需求設(shè)計(jì)相應(yīng)的“實(shí)體-關(guān)系(ER)”表格完成數(shù)據(jù)庫(kù)建模。Hartley和Mitrovic在KERMIT的基礎(chǔ)上對(duì)其進(jìn)行擴(kuò)展,開發(fā)出了E-KERMIT,在E-KERMIT中,教師可以使用專門的界面查看學(xué)生模型的全局視圖(如下頁(yè)圖4)。圖中對(duì)課程內(nèi)容按照類別進(jìn)行了劃分,展示出了ER建模的過程和概念,在開放學(xué)生模型的展示中,課程內(nèi)容的概念使用柱狀圖形進(jìn)行繪制,黑色的柱狀圖顯示學(xué)生已經(jīng)掌握的課程內(nèi)容,白色的柱狀圖顯示學(xué)生未掌握的課程內(nèi)容,并在圖中標(biāo)示出了在這個(gè)類別的概念掌握上所占的百分比。例如,在圖4中的“結(jié)構(gòu)”這一類別上,學(xué)生學(xué)習(xí)過的內(nèi)容占47%,掌握的內(nèi)容占35%,那么,他在該類別上的得分就為74.5(35/47×100)。
2.學(xué)生行蹤數(shù)據(jù)的可視化
在最近的幾年涌現(xiàn)出了許多軟件平臺(tái),平臺(tái)上的課程管理系統(tǒng)(CMS)是用來對(duì)遠(yuǎn)程學(xué)習(xí)提供支持的,該系統(tǒng)可以幫助教師發(fā)布信息、制作內(nèi)容材料、布置作業(yè)、準(zhǔn)備測(cè)試、參與討論,課程管理系統(tǒng)以日志的形式累積記錄了大量的追蹤信息,這些信息可以監(jiān)控學(xué)生的行為,但是這些文本形式的日志文件并不適宜直觀訪問,這就很難滿足教師的需求。而信息可視化技術(shù)與工具則可以將日志中的大量信息進(jìn)行可視化展示,從而為教師提供更加直觀、快速的參考。
最近,一些研究者開發(fā)出了許多圖形化展示工具用于分析學(xué)生行為數(shù)據(jù),這里僅對(duì)其中一種做介紹。CourseVis是一個(gè)能夠?qū)⒄n程管理系統(tǒng)(CMS)中的數(shù)據(jù)進(jìn)行圖形化展示的工具,它為教師查看學(xué)生的交往、認(rèn)知、行為等方面的情況提供了支持,CourseVis首先進(jìn)行系統(tǒng)的調(diào)查以查找教師想要了解的內(nèi)容,并確定獲得這些信息的可行方式。在進(jìn)行系統(tǒng)調(diào)查時(shí),首先要制作調(diào)查表,然后根據(jù)調(diào)查結(jié)果形成需求,并進(jìn)行圖形化展示的設(shè)計(jì)。圖5顯示了一個(gè)使用CourseVis生成的圖形化展示案例。該圖在二維平面空間上顯示,橫軸描繪的是課程日期,在縱軸方向上對(duì)應(yīng)許多變量,表示的是課程的具體內(nèi)容信息,該圖展示的是學(xué)生對(duì)內(nèi)容頁(yè)面的訪問、對(duì)課程的總體訪問和課程的進(jìn)度。
教師可以通過這張圖表辨別需要特殊關(guān)注的學(xué)生個(gè)體,發(fā)現(xiàn)學(xué)生在某一內(nèi)容知識(shí)上是否遇到困難,然后有針對(duì)性地對(duì)難點(diǎn)知識(shí)進(jìn)行細(xì)致講解。
結(jié)論與將來工作
在線教育系統(tǒng)聚集了大量的信息,這對(duì)分析學(xué)生的行為具有很大的價(jià)值。然而,由于這些系統(tǒng)產(chǎn)生的數(shù)據(jù)量十分龐大,使用手工方式很難處理,在過去的幾年中,研究者開始著手探索利用各種方法從中提取有價(jià)值的信息,以幫助教育者管理課程。數(shù)據(jù)挖掘與信息可視化是兩種可以用來從學(xué)生的使用數(shù)據(jù)中發(fā)現(xiàn)有用信息的方法,在本文中,我們展示了使用IV技術(shù)的一些想法和原理,利用IV技術(shù)可以將學(xué)習(xí)網(wǎng)站中搜集的信息以圖形的方式呈現(xiàn)出來。借助視覺感知能力,我們可以通過圖形化迅速展示發(fā)現(xiàn)數(shù)據(jù)的模式、規(guī)律、趨勢(shì),還可以對(duì)數(shù)據(jù)集形成一個(gè)總體的概覽。另外,我們描述了一些使用了可視化的學(xué)習(xí)系統(tǒng),用以描繪用戶模型數(shù)據(jù)、行蹤數(shù)據(jù),從中可以認(rèn)識(shí)到單獨(dú)使用數(shù)據(jù)挖掘算法是不夠的,同樣,單獨(dú)使用圖形化展示來分析復(fù)雜、龐大的數(shù)據(jù)集也并不是最有效可行的,而將數(shù)據(jù)挖掘和信息可視化兩種方法組合使用才能夠創(chuàng)建出具有更加強(qiáng)大功能的工具,未來的研究也一定會(huì)考慮兩種方法的聯(lián)合開發(fā)。