吳迪
【摘要】? 在充分考慮人工智能專業(yè)特點的基礎(chǔ)上,本文對人工智能專業(yè)數(shù)學基礎(chǔ)課的教學進行了研究和探討,特別是高等數(shù)學、線性代數(shù)、最優(yōu)化方法和數(shù)理統(tǒng)計四門數(shù)學基礎(chǔ)課.
【關(guān)鍵詞】人工智能專業(yè);高等數(shù)學;線性代數(shù);最優(yōu)化方法;數(shù)理統(tǒng)計
【基金項目】國家自然科學基金,2021年1月(62006149);陜西省自然科學基金,2020年1月(2020JQ-403)
一、引言
近年來,全國百所高校新增了人工智能本科專業(yè),該專業(yè)對數(shù)學基礎(chǔ)的要求較高.因此,該專業(yè)的數(shù)學基礎(chǔ)課教學受到廣泛的關(guān)注,是一個重要研究課題.
“機器學習”是學生選修最多的信息類專業(yè)課之一,被認為人工智能專業(yè)最核心的課程,是人工智能專業(yè)對數(shù)學基礎(chǔ)要求最高的課程之一.“最優(yōu)化方法”(以下簡稱“優(yōu)化”)和“數(shù)理統(tǒng)計”是機器學習課重要的先修數(shù)學課;“高等數(shù)學”(以下簡稱“高數(shù)”) 和“線性代數(shù)”(以下簡稱“線代”)是優(yōu)化課和數(shù)理統(tǒng)計課重要的先修數(shù)學課.
對于人工智能本科專業(yè)的二年級學生,筆者已經(jīng)講授優(yōu)化課.筆者在教學過程中發(fā)現(xiàn)數(shù)學課和機器學習課的銜接存在問題.為了改善此情況,教師應(yīng)根據(jù)機器學習課的要求對數(shù)學課的教學內(nèi)容進行調(diào)整,并根據(jù)優(yōu)化課和數(shù)理統(tǒng)計課的要求對高數(shù)課和線代課的教學內(nèi)容進行調(diào)整.
為了更加深刻地理解機器學習的本質(zhì),多數(shù)選修機器學習課的學生希望教師補充與機器學習有關(guān)的數(shù)學基礎(chǔ)知識.由于人工智能專業(yè)數(shù)學課的設(shè)置充分考慮到機器學習課的要求,本文的內(nèi)容可為這些學生提供參考.
全國高校新增了大量與人工智能相關(guān)的本科專業(yè),如智能感知工程、智能交互設(shè)計和智慧交通.這些專業(yè)的部分課程與人工智能本科專業(yè)相近,因此,本文對這些專業(yè)的教師和學生有參考價值.
二、人工智能專業(yè)數(shù)學課的設(shè)置
在筆者所在學院,人工智能本科專業(yè)是在計算機科學與技術(shù)本科專業(yè)的基礎(chǔ)上發(fā)展而來的,繼承了計算機科學與技術(shù)本科專業(yè)的相關(guān)課程,包括四門數(shù)學課(高數(shù)、線代、概率論和離散數(shù)學).
針對人工智能本科專業(yè),筆者所在學院新開設(shè)了機器學習、數(shù)據(jù)挖掘、計算機視覺、深度學習等課程.機器學習是數(shù)據(jù)挖掘、計算機視覺、深度學習等新開設(shè)課程的重要先修課程.機器學習課程被認為這些新開設(shè)課程中最核心的課程,是這些新開設(shè)課程中對數(shù)學基礎(chǔ)要求最高的課程之一.因此,筆者所在學院建議教師根據(jù)機器學習課程的要求對數(shù)學課的設(shè)置進行調(diào)整.
除了從計算機科學與技術(shù)本科專業(yè)繼承的四門數(shù)學課外,還有多門數(shù)學課與機器學習高度相關(guān).這些數(shù)學課可粗略分為兩類:“數(shù)值類”和“統(tǒng)計類”.數(shù)值類課程有數(shù)值優(yōu)化、數(shù)值計算方法和統(tǒng)計計算;統(tǒng)計類課程有數(shù)理統(tǒng)計、多元統(tǒng)計、隨機過程、貝葉斯統(tǒng)計和統(tǒng)計計算.需要注意的是,統(tǒng)計計算既在數(shù)值類課程中,又在統(tǒng)計類課程中.另外,為了方便討論,本文將隨機過程課歸入統(tǒng)計類.
筆者建議在計算機科學與技術(shù)本科專業(yè)繼承的四門數(shù)學課的基礎(chǔ)上,進一步開設(shè)與機器學習相關(guān)性較高的兩門數(shù)學課,即一門為數(shù)值類課程,一門為統(tǒng)計類課程,具體有如下兩個原因:第一,由于考慮到學時的限制,筆者建議新開設(shè)的數(shù)學課不超過兩門.第二,由于機器學習課中既用到大量數(shù)值類課程的思想,又用到大量統(tǒng)計類課程的思想,數(shù)值類課程和統(tǒng)計類課程盡可能都開設(shè).
筆者建議開設(shè)的數(shù)值類課程為優(yōu)化課,而開設(shè)的統(tǒng)計類課程為數(shù)理統(tǒng)計課,具體有如下三個原因:第一,在數(shù)值類課程中,教師一般認為優(yōu)化對機器學習課最重要.第二,在統(tǒng)計類課程中,教師一般認為數(shù)理統(tǒng)計和多元統(tǒng)計對機器學習課最重要.第三,數(shù)理統(tǒng)計是多元統(tǒng)計、貝葉斯統(tǒng)計和統(tǒng)計計算的先修課程,因此,在這四門課程中,教師一般優(yōu)先考慮開設(shè)數(shù)理統(tǒng)計課.
為了保證機器學習課的教學,教師在優(yōu)化課和數(shù)理統(tǒng)計課中可適當補充其他與機器學習相關(guān)的數(shù)學知識.另外,數(shù)學課和機器學習課講授的內(nèi)容之間相關(guān)性高,因此,數(shù)學課和機器學習課的授課教師之間應(yīng)充分溝通,避免課程講授內(nèi)容的不協(xié)調(diào).
下面分別介紹人工智能專業(yè)高數(shù)課、線代課、優(yōu)化課和數(shù)理統(tǒng)計課的教學安排.
三、人工智能專業(yè)高數(shù)課的教學
在人工智能專業(yè)的課程中,優(yōu)化課被認為對高數(shù)要求最高的課程,因此,高數(shù)課的開設(shè)應(yīng)充分考慮優(yōu)化課的要求.優(yōu)化課和機器學習課中常用到多元函數(shù)微分和向量值函數(shù)微分.因此,筆者認為在高數(shù)課中可適當加強對這部分內(nèi)容的講授.
多元函數(shù)微分是優(yōu)化課的重要基礎(chǔ).多元函數(shù)的方向?qū)?shù)與梯度是最速下降法、共軛梯度法等的基礎(chǔ);多元函數(shù)的泰勒公式是牛頓法、擬牛頓法等的基礎(chǔ).因此,在高數(shù)課的教學過程中,教師應(yīng)更重視對這部分內(nèi)容的講授.
高數(shù)教材通常將向量值函數(shù)微分作為選修內(nèi)容,而且教師一般不對其進行講授.然而,優(yōu)化課和機器學習課常用到向量值函數(shù)微分,如神經(jīng)網(wǎng)絡(luò)的算法推導(dǎo)用到向量值函數(shù)微分.因此,教師應(yīng)在高數(shù)的教學過程中講授向量值函數(shù)微分的內(nèi)容.
如果課時允許,那么教師還可以在高數(shù)課中補充范數(shù)和泛函數(shù)的基本內(nèi)容,這些知識與機器學習課和優(yōu)化課的相關(guān)性較高,如KL散度和變分推斷法就用到泛函數(shù)的思想.
四、人工智能專業(yè)線代課的教學
數(shù)理統(tǒng)計課、優(yōu)化課和機器學習課中常用到矩陣、二次型和線性變換的相關(guān)內(nèi)容.因此,筆者認為在線代課中可適當加強對這部分內(nèi)容的講授.
矩陣是人工智能專業(yè)課程中的重要概念,也是二次型和線性變換的基礎(chǔ).在數(shù)理統(tǒng)計課中,協(xié)方差矩陣是教學的重點和難點.在優(yōu)化課中,黑塞矩陣是最優(yōu)性條件、牛頓法和擬牛頓法的基礎(chǔ).
二次型是數(shù)理統(tǒng)計課和優(yōu)化課的重要基礎(chǔ).在數(shù)理統(tǒng)計課中,正態(tài)分布的概率密度函數(shù)用到二次型.在優(yōu)化課中,共軛梯度法、牛頓法和擬牛頓法用到二次型.
線性變換是數(shù)理統(tǒng)計課和機器學習課的核心之一.在數(shù)理統(tǒng)計課中,教師常用線性變換將一般正態(tài)分布變?yōu)闃藴收龖B(tài)分布.在多層神經(jīng)網(wǎng)絡(luò)中,相鄰隱含層關(guān)系的構(gòu)建用到線性變換.
五、人工智能專業(yè)優(yōu)化課的教學
在充分考慮機器學習課要求的基礎(chǔ)上,本文具體介紹了人工智能專業(yè)優(yōu)化課的教學安排.優(yōu)化課中通常包括以下三個方面的內(nèi)容.
(一)教材選擇
在人工智能專業(yè)中,為了保證先修課程和后續(xù)課程的開設(shè),機器學習課常在本科三年級第一學期開設(shè).優(yōu)化課的開設(shè)一般早于機器學習課且晚于高數(shù)課,因此,優(yōu)化課一般在本科二年級開設(shè).教材選擇對優(yōu)化課教學的開展至關(guān)重要,下面將分別討論三類常見的優(yōu)化課教材.
第一類優(yōu)化課(常稱作“運籌學”)教材主要針對經(jīng)濟和管理專業(yè)的學生,其中的大部分內(nèi)容與機器學習課的相關(guān)性較低,因此,筆者認為這類教材不太適合人工智能專業(yè).
第二類優(yōu)化課教材主要針對工科專業(yè)研究生和數(shù)學專業(yè)本科生,其對數(shù)學基礎(chǔ)要求較高且難度較高.在人工智能專業(yè)中,低年級學生的數(shù)學基礎(chǔ)一般且理解程度有待提高,因此,筆者認為這類教材不太適合人工智能專業(yè).
第三類優(yōu)化課教材主要針對工科專業(yè)本科生,其與機器學習課的相關(guān)性較高,對數(shù)學基礎(chǔ)要求適中且難度適中,因此,筆者認為這類教材適合人工智能專業(yè).
(二)理論內(nèi)容的教學
筆者在教學過程中發(fā)現(xiàn)優(yōu)化課理論內(nèi)容的難度高,對數(shù)學基礎(chǔ)的要求高,在開設(shè)過程中遇到的問題一般多于同期開設(shè)的數(shù)學課.因此,教師應(yīng)在講授時放慢節(jié)奏且多提問題,讓學生有充足的思考時間.
大量機器學習模型的訓練要用到優(yōu)化方法,如神經(jīng)網(wǎng)絡(luò)的訓練一般用到最速下降法,而支持向量機的訓練用到對偶問題的知識.因此,優(yōu)化課的教學應(yīng)充分考慮機器學習的要求.
教師可以先重點講授無約束非線性規(guī)劃,再重點講授約束非線性規(guī)劃.為了幫助學生理解約束非線性規(guī)劃,教師可以在講授約束非線性規(guī)劃前適當講授線性規(guī)劃的內(nèi)容.如果課時有限,那么教師可以不講授多目標規(guī)劃問題、離散型優(yōu)化問題等.
對于線性規(guī)劃,教師可以講授幾何特征、標準型和對偶問題;對于無約束非線性規(guī)劃,教師可以講授教材里的全部內(nèi)容;對于約束非線性規(guī)劃,教師可以講授KT條件、泛函數(shù)法和可行方向法.如果課時不夠,那么教師可以不講授泛函數(shù)法或可行方向法.
數(shù)值計算方法是多門人工智能專業(yè)課程的基礎(chǔ).神經(jīng)網(wǎng)絡(luò)等很多機器學習模型本質(zhì)上是在解決函數(shù)逼近問題.在優(yōu)化課、數(shù)理統(tǒng)計課和機器學習課中,黑塞矩陣、協(xié)方差矩陣等的計算常用到矩陣計算的知識.在數(shù)理統(tǒng)計課和機器學習課中,期望等的求解常用到數(shù)值積分.在優(yōu)化課和機器學習課中,梯度等的求解常用到數(shù)值微分.因此,教師可以在優(yōu)化課中補充數(shù)值計算方法的相關(guān)內(nèi)容,如函數(shù)逼近、矩陣計算、數(shù)值積分和數(shù)值微分.
智能計算是優(yōu)化課的重要后續(xù)課程,與優(yōu)化課關(guān)系密切,主要講授一類求解函數(shù)極值的方法.如果開設(shè)智能計算課,教師就可以不在優(yōu)化課里補充智能計算的部分內(nèi)容;如果不開設(shè)智能計算課,教師就可以在優(yōu)化課里補充智能計算的部分內(nèi)容.
(三)實踐內(nèi)容的教學
大部分人工智能專業(yè)的學生將來不是在高校和研究所從事人工智能科學研究,而是在百度、阿里巴巴等公司解決人工智能技術(shù)問題,這些公司對學生算法設(shè)計和算法實現(xiàn)能力的要求較高.因此,在優(yōu)化課上,教師應(yīng)重視算法設(shè)計和算法實現(xiàn)內(nèi)容的教學.
上機實踐能訓練學生的算法設(shè)計能力和算法實現(xiàn)能力,因此,教師有必要在學校機房開設(shè)實踐課.如果沒有條件開設(shè)實踐課,教師就可以布置實踐作業(yè),并讓學生在課下完成這些作業(yè).
一些學校要求期末考試成績的占比不得低于70%,而且一般情況下,期末考試主要考查理論內(nèi)容.鑒于實踐內(nèi)容難以考查的現(xiàn)狀,這些學校實踐內(nèi)容的課時應(yīng)略少于理論內(nèi)容.
優(yōu)化教材通常以Matlab作為編程語言,但對人工智能專業(yè)應(yīng)以Python作為優(yōu)化課的編程語言,具體有如下兩個原因:第一,Matlab軟件的購買價格過高.第二,Python是人工智能領(lǐng)域應(yīng)用最廣泛的編程語言,是人工智能專業(yè)課程使用最多的編程語言.為了保證教學效果,筆者建議在優(yōu)化課前開設(shè)Python課.
六、人工智能專業(yè)數(shù)理統(tǒng)計課的教學
在數(shù)理統(tǒng)計課中,教師可以補充多元統(tǒng)計、隨機過程和貝葉斯統(tǒng)計的相關(guān)內(nèi)容,如多元回歸分析、判別分析、聚類分析、主成分分析、馬爾可夫鏈和貝葉斯推斷.在優(yōu)化課或數(shù)理統(tǒng)計課中,教師可以補充統(tǒng)計計算的相關(guān)內(nèi)容,如蒙特卡洛方法和期望最大化算法.
統(tǒng)計計算的內(nèi)容是在優(yōu)化課中補充還是在數(shù)理統(tǒng)計課中補充,要視具體情況而定.如果優(yōu)化課在數(shù)理統(tǒng)計課后開設(shè),那么教師應(yīng)在優(yōu)化課里補充統(tǒng)計計算的內(nèi)容;如果優(yōu)化課不在數(shù)理統(tǒng)計課后開設(shè),那么教師應(yīng)在數(shù)理統(tǒng)計課里補充統(tǒng)計計算的內(nèi)容.以上安排可保證,在教師講授統(tǒng)計計算的內(nèi)容時,這兩門課與統(tǒng)計計算相關(guān)性高的內(nèi)容基本講授完成.
多元統(tǒng)計課、統(tǒng)計計算課和機器學習課研究的對象一般都是多維數(shù)據(jù),并且三門課共同關(guān)注一些問題,如多元回歸分析、判別分析、聚類分析和特征提取(降維).由于三門課的高度相關(guān)性,筆者認為在機器學習課前,教師適當講授多元統(tǒng)計和統(tǒng)計計算的內(nèi)容是有必要的.
【參考文獻】
[1]南京大學人工智能學院.南京大學人工智能本科專業(yè)教育培養(yǎng)體系[M].北京:機械工業(yè)出版社,2019.
[2]陳愛斌,張釗源.人工智能專業(yè)數(shù)值分析課程教學研究與探討[J].計算機教育,2019(10):71-73.
[3]李航.統(tǒng)計學習方法(第2版)[M].北京:清華大學出版社,2019.
[4]施光燕,錢偉懿,龐麗萍.最優(yōu)化方法(第二版)[M].北京:高等教育出版社,2007.
[5]馬昌鳳.最優(yōu)化方法及其Matlab程序設(shè)計[M].北京:科學出版社,2010.
[6]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(第四版)[M].北京:高等教育出版社,2010.
[7]華東師范大學數(shù)學系.數(shù)學分析:下冊(第四版)[M].北京:高等教育出版社,2010.
[8]北京大學數(shù)學系幾何與代數(shù)教研室前代數(shù)小組.高等代數(shù)(第三版)[M].北京:高等教育出版社,2007.