徐 宏
(安徽工業(yè)大學工商學院 教務處,安徽 馬鞍山243002)
教育部門如何清晰掌控高校的規(guī)模和辦學條件,實時監(jiān)測各高校發(fā)展狀態(tài),全面掌握我國高等教育發(fā)展狀況,為高等教育的發(fā)展和評估提供重要的參考決策依據(jù),已是迫切需要解決的難題。2007教育部啟動了“全國高校教學基本狀態(tài)數(shù)據(jù)庫系統(tǒng)”項目,華中科技大學、中山大學、北京師范大學參與了這個項目的主要研究工作。標志著我國教學狀態(tài)數(shù)據(jù)庫建設進入了一個新的研究階段。建設全國高?!敖虒W狀態(tài)數(shù)據(jù)庫”,是評估和分析我國高等教育現(xiàn)狀以及個體學校辦學水平的重要參考依據(jù),是提高我國高等教育質量的重要手段。對于高校個體,除了做好國家教育部門規(guī)定上報的教學基礎數(shù)據(jù)外,還要建立好本校的個性化的為明確學校發(fā)展方向、教學質量監(jiān)控、人才培養(yǎng)質量的提高等提供重要參考依據(jù)的教學狀態(tài)數(shù)據(jù)庫。本文對高校教學狀態(tài)數(shù)據(jù)庫的內容做了詳細的闡述,并對教學狀態(tài)數(shù)據(jù)進行了分類;然后就如何建設高校教學狀態(tài)數(shù)據(jù)庫以及高校教學狀態(tài)數(shù)據(jù)庫后期的研究方向提出了一些想法。
所謂“教學狀態(tài)數(shù)據(jù)庫”,是以院校、政府和社會大眾為服務對象,利用信息和網(wǎng)絡技術,按照教學工作的基本規(guī)律,把高等學校與教學工作密切相關的數(shù)據(jù)按照一定的邏輯關系組織起來,形成的全面反映高等學校教學運行狀態(tài)的數(shù)據(jù)集。[1]基于高校的教學狀態(tài)數(shù)據(jù)庫主要從高校師資、科研、實驗室、教學設備、教學運行、學科競賽、招生、就業(yè)、獎勵等多個方面進行統(tǒng)計,通過掌握這些基礎數(shù)據(jù)進而挖掘各類數(shù)據(jù)之間的聯(lián)系和規(guī)律,實現(xiàn)對辦學水平和辦學條件以及教學質量的一個全面把握和分析,為不斷明確辦學思路、優(yōu)化辦學結構、提高教學質量提供重要的決策依據(jù)。
根據(jù)數(shù)據(jù)的來源可以將教學狀態(tài)數(shù)據(jù)分為行政數(shù)據(jù)和業(yè)務數(shù)據(jù)。行政數(shù)據(jù)主要是記載學?;举Y料、師資情況、在校生人數(shù)、專業(yè)學科分布、教學儀器設備、實驗室軟硬件、培養(yǎng)計劃、教學場地、圖書資料等靜態(tài)狀態(tài)數(shù)據(jù),該類數(shù)據(jù)是學校硬件建設和辦學軟件條件的一個真實記錄,如圖1所示。行政數(shù)據(jù)的獲取和統(tǒng)計較為簡單,但卻是非常重要的教學狀態(tài)數(shù)據(jù),是進行教學狀態(tài)分析不可缺少的基礎數(shù)據(jù)。業(yè)務數(shù)據(jù)是指通過各種教學活動、競賽活動、科研活動、社會活動所產(chǎn)生的衍生數(shù)據(jù),如教學任務、科研活動、課程成績、科技競賽參加和獲獎情況、考研情況、實驗項目開出情況、教學質量監(jiān)控數(shù)據(jù)等在學生和教師的學習科研活動中產(chǎn)生的數(shù)據(jù),如圖2所示。這類數(shù)據(jù)種類繁多,數(shù)據(jù)量大,獲取途徑較為復雜,統(tǒng)計方式多樣,因此對這類數(shù)據(jù)的采集和統(tǒng)計需要精心設計,達到操作方便,統(tǒng)計靈活。
建設高校教學狀態(tài)數(shù)據(jù)庫要從數(shù)據(jù)來源豐富性與可靠性、系統(tǒng)操作方便、數(shù)據(jù)統(tǒng)計有效性等方面綜合考慮,這樣才能確保數(shù)據(jù)庫建設可行、維護方便、數(shù)據(jù)有效,并且能夠指導實踐。
圖1 行政數(shù)據(jù)內容
圖2 業(yè)務數(shù)據(jù)內容
行政數(shù)據(jù)內容除了考慮學校業(yè)務數(shù)據(jù)的統(tǒng)計需要外,還要按照教育部高?;緮?shù)據(jù)報表的格式要求以及全國高校教學基本狀態(tài)數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)標準,做好本校的教學狀態(tài)數(shù)據(jù)庫設計,同時要兼顧教育部評估指標體系的要求,根據(jù)評估指標體系標準和要求采集和統(tǒng)計數(shù)據(jù),數(shù)據(jù)庫的建立與統(tǒng)計要能夠反映評估指標的內容。行政數(shù)據(jù)主要來自學校各行政部門,如人事、資產(chǎn)、科研、教務等多個部門,如果各行政部門有業(yè)務系統(tǒng),要做到與各部門業(yè)務系統(tǒng)的自動對接,實時讀取數(shù)據(jù),如果沒有業(yè)務系統(tǒng)要實現(xiàn)數(shù)據(jù)的錄入與導入功能,而且數(shù)據(jù)的采集與管理需要專人管理,保證數(shù)據(jù)的完整性和專業(yè)性。
由于業(yè)務數(shù)據(jù)存在數(shù)據(jù)量大、結構復雜、數(shù)據(jù)的產(chǎn)生具有周期性和關聯(lián)性等特點,而且有些數(shù)據(jù)必須要有業(yè)務系統(tǒng)支持,如教學運行數(shù)據(jù)、成績數(shù)據(jù)、招生畢業(yè)、學籍異動、學生獎懲數(shù)據(jù)等。業(yè)務數(shù)據(jù)庫的建立與統(tǒng)計要按照學校辦學水平和反映教學質量為主要依據(jù),從實際出發(fā),收集大量原始真實的數(shù)據(jù),然后通過統(tǒng)計分析和數(shù)據(jù)挖掘的手段來發(fā)現(xiàn)影響教學質量和人才培養(yǎng)質量的關鍵因素。因此業(yè)務數(shù)據(jù)的采集要廣泛和真實,在統(tǒng)計和挖掘上要參照評估指標要求,分析各項教學指標數(shù)據(jù),實現(xiàn)橫向和縱向比較,得到使其能夠真正反映教學效果和教學問題的數(shù)據(jù)。
由于高校業(yè)務系統(tǒng)復雜多樣,沒有統(tǒng)一的建設標準,而且業(yè)務系統(tǒng)會隨著業(yè)務流程的變化經(jīng)常進行調整,因此要建立高校教學狀態(tài)數(shù)據(jù)庫在接口設計上要充分考慮到業(yè)務系統(tǒng)的變化,教學狀態(tài)數(shù)據(jù)庫的管理與維護要與業(yè)務系統(tǒng)盡量實現(xiàn)低耦合??梢酝ㄟ^設計中間件的方式來實現(xiàn)業(yè)務系統(tǒng)和教學狀態(tài)數(shù)據(jù)庫的對接,以實現(xiàn)對于相同業(yè)務不同業(yè)務系統(tǒng)只需改變中間件而不用修改教學狀態(tài)數(shù)據(jù)庫本身。
為了較好地實現(xiàn)教學狀態(tài)數(shù)據(jù)的統(tǒng)計分析,教學狀態(tài)數(shù)據(jù)庫要存儲所有基礎數(shù)據(jù),從而保證教學狀態(tài)數(shù)據(jù)庫的統(tǒng)計方式和分析方法的確定性。因此,教學狀態(tài)數(shù)據(jù)庫分為兩部分,一部分為基礎數(shù)據(jù)庫,存儲來自各業(yè)務系統(tǒng)的基礎數(shù)據(jù),展示數(shù)據(jù)的原始狀態(tài);另一部分為根據(jù)統(tǒng)計分析需要而進行格式化后的統(tǒng)計結果數(shù)據(jù),該類數(shù)據(jù)主要展示各種狀態(tài)數(shù)據(jù)進行加工后的結果。
教學狀態(tài)數(shù)據(jù)庫首先要收集影響高校辦學水平的各種條件因素信息,獲取全面的基礎性的原始數(shù)據(jù)是進行數(shù)據(jù)分析的第一步。根據(jù)教育部高?;緮?shù)據(jù)報表要求以及教育部評估中心關于做好普通高校本科教學工作合格評估文件要求,考查高校辦學水平、辦學層次應從教師隊伍、教學條件與利用、專業(yè)與課程建設、質量管理、學風建設、教學質量等多個方面去監(jiān)測。
1.行政數(shù)據(jù)
首先,設計原始數(shù)據(jù)的行政數(shù)據(jù)部分。行政原始數(shù)據(jù)主要數(shù)據(jù)實體有:教師隊伍、教學設備、學生信息、教學場地。每個實體的屬性如下。
教師隊伍:教師工號、姓名、性別、出生日期、最高學歷、最后職稱、最后學歷畢業(yè)學校、專業(yè)、所屬部門、其他屬性。
教學設備:設備編號、設備名稱、單價、臺套數(shù)、使用對象、所屬部門、保管人、其他屬性。
學生信息:學號、姓名、性別、出生日期、生源地、政治面貌、考生類別、班級、年級、專業(yè)、系、高考總分、英語成績、數(shù)學成績、興趣愛好、特長、其他屬性。
教學場地:教室名稱、座位數(shù)、考試人數(shù)、教室類型、樓號、樓層等。
為了更好地描述實體,還需要建立一些關系表。如為了更好地描述教師的發(fā)展經(jīng)歷,需要增加一個描述教師進修過程的表格:教師工號、職稱、評職時間、學歷、或學歷日期、或學歷學校、學習形式等。這樣能夠記錄教師的全部學習經(jīng)歷,方便統(tǒng)計歷史數(shù)據(jù),形成數(shù)據(jù)的對比。
2.業(yè)務邏輯數(shù)據(jù)
業(yè)務邏輯數(shù)據(jù)表的設計,主要是圍繞教學活動設計相關數(shù)據(jù)表格,分為基本教學過程數(shù)據(jù)、教學結果數(shù)據(jù)、質量監(jiān)控數(shù)據(jù)。三者之間關系如圖3所示。通過教學過程產(chǎn)生一些教學結果數(shù)據(jù),通過對教學結果的分析用來指導和改善教學過程,通過對教學過程的監(jiān)控和測評,用來規(guī)范教學過程,形成有效的閉環(huán)系統(tǒng),從而有效促進教學活動的改善,提高教學質量。
教學過程數(shù)據(jù)有:教學計劃、教學任務、實驗進程表、畢業(yè)設計課題、實習實踐活動等,主要實現(xiàn)對教學活動安排,教學過程的監(jiān)測。通過這些數(shù)據(jù)可以把握學校教學活動、教學要求是否符合相關要求與標準。教學計劃表主要了解各專業(yè)課程結構、學時、學分分布情況,從而清楚了解學校專業(yè)培養(yǎng)方案合理情況;通過教學任務數(shù)據(jù)可以了解學校課程開設情況、多媒體教室使用情況、各類職稱教師的授課比例情況、素質教育選修課的開課情況等。
圖3 業(yè)務數(shù)據(jù)關系圖
教學結果數(shù)據(jù)有:課程成績、畢業(yè)情況、等級考試成績、科技競賽等。課程成績主要屬性有課程名稱、學分、學時、課程性質、課程類別、學號、成績、是否補考、是否重修、學期、授課教師等信息,通過這些屬性的描述可以為反映學生學習結果以及教師授課效果提供原始統(tǒng)計數(shù)據(jù)。畢業(yè)情況主要屬性有:學號、姓名、專業(yè)、年級、班級、畢業(yè)結論、學位授予情況、就業(yè)情況、考研情況等。主要反映畢業(yè)生畢業(yè)率、學位授予率、就業(yè)率、考研率、不授予學位原因等情況。通過對畢業(yè)生的畢業(yè)情況的統(tǒng)計分析可以了解學生培養(yǎng)結果存在哪些問題,需要采取什么樣的應對措施。等級考試情況和學科競賽主要考察學生橫向比較結果。由于等級考試和學科競賽主要是各高校之間的比較,通過對這些數(shù)據(jù)的橫向和縱向的比較可以了解學校人才培養(yǎng)在近幾年來的發(fā)展趨勢,以及在國內高校的位置情況。同時將結果與課程成績、畢業(yè)情況結合分析,可挖掘二者之間的聯(lián)系。
質量監(jiān)控數(shù)據(jù)主要有:學生評教、教師評學、教學檢查等教學質量監(jiān)控所產(chǎn)生的數(shù)據(jù)。質量監(jiān)控是對教學過程、教學材料、教學效果、學生學風、學習習慣等教學過程的監(jiān)督調查過程。通過學生評教可以了解教師教學過程中是否符合學生習慣,是否勝任課堂教學,存在什么樣的問題,主要屬性有:課程信息、指標體系、評分、意見和建議等。教師評學主要是通過教師對授課課程班級學生學習習慣、學習風氣等方面進行評價,及時了解學生學習狀態(tài)。另外,教學資料檢查以及教學規(guī)范檢查主要是檢查教師的教學過程和教學資料的規(guī)范情況,主要屬性有:教師信息、課程信息、教學日歷、作業(yè)批改、教學大綱、課件、資料評分等與教學相關的教學材料信息。
三種邏輯數(shù)據(jù)中,教學活動是根本,教學結果是目標,質量監(jiān)控制保障。對三者數(shù)據(jù)的分析是相互交叉進行的,通過質量保障可以研究教學結果與教學過程中蘊藏的大量因果聯(lián)系,挖掘對教風、學風、教學效果等形成重要影響的諸多因素。
原始數(shù)據(jù)采集完畢,可以滿足日常報表統(tǒng)計需要,以及廣大教職工對教學情況的基本了解,更為重要的是可以挖掘分析教學過程中一些活動之間的聯(lián)系和牽連關系。因此運用數(shù)據(jù)挖掘的技術發(fā)現(xiàn)師生各種教學行為活動之間的聯(lián)系,從而干預和引導教學之間的行為,形成良性的教學活動氛圍是教學基本狀態(tài)數(shù)據(jù)庫系統(tǒng)的重要研究內容。數(shù)據(jù)挖掘是人工智能與數(shù)據(jù)庫技術相結合的產(chǎn)物,其中許多方法來源于機器學習。因此,數(shù)據(jù)挖掘技術主要有關聯(lián)規(guī)則、序列模式、分類/回歸分析、決策樹、聚類、神經(jīng)網(wǎng)絡、Web挖掘等等。[2]
由于教學狀態(tài)數(shù)據(jù)的挖掘過程非常復雜,而且根據(jù)不同的教學成果數(shù)據(jù)需要建立不同的挖掘方法和模型,本文不再對具體方法展開。通過對教學成果數(shù)據(jù),如成績、畢業(yè)、學風、就業(yè)、競賽等數(shù)據(jù)與教學質量監(jiān)督數(shù)據(jù)進行關聯(lián)分析,發(fā)現(xiàn)不同教師的教學方式和教學活動會產(chǎn)生什么樣的學風、學習成果,教師授課方式與學生成績之間關系,學生評教與教師評學數(shù)據(jù)是否能夠真實反映實際教學狀態(tài)等等。總而言之,對教學數(shù)據(jù)進行挖掘主要實現(xiàn)兩個目的:一是發(fā)現(xiàn)教學模式、管理模式的科學性和合理性,即對教學起正面效應的行為;二是驗證教學質量監(jiān)控考核方式的合理性和實效性,即目前的教學質量監(jiān)控體系是否合理,是否能夠真實反映實際情況,對教學質量的提高能夠真正起到監(jiān)督和指導作用。
高校教學狀態(tài)數(shù)據(jù)庫的建設是個不斷完善和優(yōu)化的過程,應該隨著高校教學模式的變化以及在數(shù)據(jù)庫研究的過程中不斷優(yōu)化,而不是一成不變的。本文主要提出了高校教學基本狀態(tài)數(shù)據(jù)庫的建設基本思路和建設內容,對教學狀態(tài)數(shù)據(jù)進行了分類和簡要的羅列,數(shù)據(jù)庫具體的實施細節(jié)以及教學狀態(tài)數(shù)據(jù)的挖掘算法將是下一步主要研究的內容。
[1]許曉東.全國高校教學基本狀態(tài)數(shù)據(jù)庫的研究與應用[J].中國大學教育,2012(4):83-87.
[2]SOMAN K P,等.數(shù)據(jù)挖掘基礎教程[M].范明,牛常勇,譯.北京:機械工業(yè)出版社,2009:1-25.