張笑笑
沈琳琳,深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院教授,廣東省教育廳中英合作視覺信息處理實(shí)驗(yàn)室主任、深圳大學(xué)計(jì)算機(jī)視覺研究所所長、博士生導(dǎo)師、英國諾丁漢大學(xué)計(jì)算機(jī)學(xué)院榮譽(yù)教授。上海交通大學(xué)學(xué)士、碩士,英國諾丁漢大學(xué)博士。
作為負(fù)責(zé)人主持國家自然科學(xué)基金項(xiàng)目、廣東省自然科學(xué)基金項(xiàng)目和深圳市科技計(jì)劃項(xiàng)目20余項(xiàng),作為第一發(fā)明人獲發(fā)明專利2項(xiàng)。發(fā)表學(xué)術(shù)論文100余篇,其中SCI檢索50篇,EI檢索80篇。據(jù)Google Scholar,論文總被引用次數(shù)2032,H指數(shù)20。擔(dān)任《ISRN Signal Processing》編委,《IEEE Trans. on Image Processing》《IEEE Trans. on Multimedia》《Pattern Recognition》《Image & Vision Computing》和《Computer Vision & Image Understanding》等國際重要期刊的審稿人。
現(xiàn)為廣東省高?!扒О偈こ獭迸囵B(yǎng)對象,深圳市高層次“地方領(lǐng)軍人才”,深圳市海外高層次人才,深圳市十佳青年教師。曾獲2008年深圳市科技創(chuàng)新獎(jiǎng)、2012年深圳市自然科學(xué)獎(jiǎng)、2013年廣東省科學(xué)技術(shù)獎(jiǎng)、2015年中國電子學(xué)會科學(xué)技術(shù)獎(jiǎng)、2010年國際期刊《Image and Vision Computing》最多他引論文獎(jiǎng)。2015、2016連續(xù)2年被愛思維爾出版社評為計(jì)算機(jī)學(xué)科“中國高被引學(xué)者”。
專家簡介:
2016年3月,AlphaGo和李世石的世紀(jì)大戰(zhàn)點(diǎn)燃了大眾對“人工智能”的熱情和討論,“機(jī)器學(xué)習(xí)”“深度學(xué)習(xí)”等專有詞匯一時(shí)間傾瀉而來,它們之間到底有何區(qū)別?
深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院教授沈琳琳介紹說,人工智能是一個(gè)愿景和目標(biāo),機(jī)器學(xué)習(xí)是人工智能范疇下的一種工具,深度學(xué)習(xí)則是機(jī)器學(xué)習(xí)里面一個(gè)分支,強(qiáng)調(diào)的是所使用的模型。交談中,沈琳琳無不流露出對這個(gè)新興領(lǐng)域的喜愛。而他主攻的圖像處理和模式識別就屬于人工智能的重要組成部分。
結(jié)緣“Gabor小波”
20世紀(jì)初,一個(gè)名叫Dennis Gabor的人提出了“Gabor函數(shù)”的概念,從此人們用他的名字來命名使用該函數(shù)的小波,即Gabor小波。那時(shí),Gabor小波還只是一維的,也并沒有應(yīng)用于識別領(lǐng)域;后來經(jīng)過發(fā)展,它提升為二維。直到1994年,英國劍橋大學(xué)約翰·道格曼使Gabor小波的發(fā)展產(chǎn)生了質(zhì)的飛躍。他用Gabor函數(shù)跟貓的視覺皮層的響應(yīng)函數(shù)做比較,觀察貓?jiān)诳礀|西時(shí)皮層是如何興奮的,以及神經(jīng)元興奮響應(yīng)的函數(shù)。研究后他發(fā)現(xiàn),二者很像,這說明用Gabor小波函數(shù)分析圖像是有生理基礎(chǔ)的,于是他開發(fā)了第一個(gè)虹膜掃描及辨識的算法,并申請了專利。
“Gabor小波應(yīng)用的很成功!”2002年,沈琳琳受英國政府海外研究獎(jiǎng)學(xué)金資助遠(yuǎn)赴諾丁漢大學(xué)攻讀博士,主要從事人臉識別研究,那時(shí)他用到最多的方法就是Gabor小波函數(shù),“用這種方法來提取特征,人臉識別準(zhǔn)確率很高”。初獲成功點(diǎn)燃了沈琳琳的興趣,他開始閱讀大量的文獻(xiàn),隨著研究的深入,他發(fā)現(xiàn)Gabor小波性能很好,但問題同樣存在——計(jì)算量比較復(fù)雜,特征維度很高——計(jì)算效率低。“當(dāng)時(shí)我做了一個(gè)重要的工作就是找到一個(gè)方法,通過特征選取,把不重要的去掉,使特征維度縮短,從而加快提取的速度,最終達(dá)到又準(zhǔn)又快?!彼麑Σ捎肎abor特征的二維人臉識別方法進(jìn)行了全面、深入的總結(jié),對不同方法的思想、原理及其優(yōu)缺點(diǎn)進(jìn)行了歸納分析,通過互信息和Boosting算法對小波的位置、中心頻率以及方向進(jìn)行選擇,最后只采用其中關(guān)鍵的數(shù)百個(gè)特征進(jìn)行識別,從而在準(zhǔn)確性降低很少的情況下大大提高了識別系統(tǒng)的效率。研究成果“A review on Gabor wavelets for face recognition”發(fā)表于《Pattern Analysis and Applications》雜志,目前據(jù)Google統(tǒng)計(jì)被引用次數(shù)已達(dá)362次;研究成果“MutualBoost learning for selecting Gabor features for face recognition”發(fā)表在《Pattern Recognition Letters》,目前據(jù)Google統(tǒng)計(jì)被引用次數(shù)已達(dá)101次。
博士期間,沈琳琳獲得了“國家優(yōu)秀自費(fèi)留學(xué)生”獎(jiǎng)勵(lì)。畢業(yè)后,他進(jìn)入英國諾丁漢大學(xué)醫(yī)學(xué)院擔(dān)任Research Fellow。諾丁漢大學(xué)因核磁共振儀而聞名。2003年,美國伊利諾大學(xué)香檳分?;瘜W(xué)系教授保羅·勞特伯與英國諾丁漢大學(xué)教授彼得·曼斯菲爾因在核磁共振成像技術(shù)方面貢獻(xiàn)重大,獲得諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)。沈琳琳也自然投入到大腦核磁共振(MRI)圖像處理和基于MRI圖像的大腦疾病分析研究工作中,參與多個(gè)基于Gabor小波的醫(yī)學(xué)圖像處理項(xiàng)目。所謂的“核磁共振成像”就是將人體置于特殊的磁場中,用無線電射頻脈沖激發(fā)人體內(nèi)氫原子核,引起氫原子核共振,并吸收能量。在停止射頻脈沖后,氫原子核會按特定頻率發(fā)出射電信號,并將吸收的能量釋放,被體外的接受器收錄,經(jīng)電子計(jì)算機(jī)處理獲得圖像。這是前期工作,而沈琳琳所要做的是后期處理,“拿到核磁共振的圖像后,我需要做一些圖像處理,醫(yī)生再在這基礎(chǔ)上比較正常和患某種疾病的大腦的異同,分析疾病的原理?!?/p>
從二維到三維
提到圖像處理,一定離不開“模式識別”。模式識別是一個(gè)大領(lǐng)域,可識別的內(nèi)容有很多,比如圖像、語音等?!皥D像的來源很廣泛,如攝像頭拍照、醫(yī)學(xué)X光掃描等,但不論設(shè)備是什么,最后得出的都是圖像”。得到圖像后,下一步就要開始理解圖像。如何理解?這涉及到“人是如何看圖像的”。早期,犯罪嫌疑人在紙上印下自己的指紋印,由法官憑借肉眼判斷兩個(gè)指紋是否為同一人。這是最原始的識別。隨著科技的日新月異,技術(shù)愈發(fā)可以解放人力,簡言之,沈琳琳的研究內(nèi)容就是設(shè)計(jì)一個(gè)“機(jī)器”取代人眼,從而把圖像內(nèi)容識別出來。這需要他學(xué)習(xí)人類觀察事物的方法,掌握不同領(lǐng)域的專業(yè)知識作為基礎(chǔ)??v觀全局,這其實(shí)是一個(gè)輸入和輸出的過程,沈琳琳的任務(wù)就是中間過程中的轉(zhuǎn)化連接。endprint
后來,他在對Gabor小波抽取信號特征機(jī)理進(jìn)行深入研究的基礎(chǔ)上,結(jié)合核方法、信息理論和支持向量機(jī),構(gòu)建了高效而魯棒的人臉、掌紋、指紋以及硬幣識別系統(tǒng)。
“我想把所做的研究與實(shí)際產(chǎn)業(yè)進(jìn)一步結(jié)合,在英國只是做純粹的研究,產(chǎn)業(yè)結(jié)合沒有太多的機(jī)會,而且文化不同,結(jié)合的難度也比較大?!庇谑?,在2006年沈琳琳結(jié)束海外漂泊,回國加入深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院。
一個(gè)人在國外,遠(yuǎn)離親人又面臨著文化差異,困難程度可想而知,沈琳琳堅(jiān)持了過來?;貒?,他依舊舉步艱難。由于錯(cuò)過了申請碩士生導(dǎo)師的時(shí)間,沈琳琳沒有自己的學(xué)生,做事情都只能靠自己,一個(gè)人寫申請書,一個(gè)人做研究,一個(gè)人敲代碼,“開頭很難”,話語間仍能體會他當(dāng)時(shí)的艱辛與酸楚?!白隹蒲凶钪匾氖菆?jiān)持”,因?yàn)槭冀K如一的信仰,沈琳琳咬牙度過了最難的開創(chuàng)期。
在深圳大學(xué),沈琳琳延續(xù)了在國外的研究內(nèi)容,希望對一些固有問題提出新的解決方法?!氨热缬姓趽?、光照暗,人臉識別就會受到影響,準(zhǔn)確率低”。他的第一個(gè)項(xiàng)目國家自然基金項(xiàng)目“基于過完備感知模型和稀疏表示的有遮擋人臉識別研究”意在解決這一問題?!暗沁@個(gè)方法解決問題的同時(shí)自己本身也存在一些問題——字典計(jì)算量比較大,不容易找出解”,對此他申請了第二個(gè)國家自然基金項(xiàng)目“過完備字典自適應(yīng)優(yōu)化理論及應(yīng)用研究”。就這樣,沈琳琳受“問題驅(qū)動(dòng)”意識影響,不斷地發(fā)現(xiàn)問題、尋找解決方法。
當(dāng)時(shí)Gabor小波還主要用于二維圖像,“在二維圖像上效果那么好,能不能用到三維圖像上?”于是沈琳琳開拓性地將三維Gabor小波應(yīng)用于三維大腦核磁共振圖像配準(zhǔn)以及高光譜遙感影像分類領(lǐng)域。他提出了一種基于三維Gabor小波的配準(zhǔn)性能評判方法,即通過對配準(zhǔn)后三維MRI圖像的局部結(jié)構(gòu)進(jìn)行分析,可以快速、客觀地給出性能指標(biāo)。方法能廣泛應(yīng)用于配準(zhǔn)算法的選擇、參數(shù)選取,最終推動(dòng)基于三維MRI圖像的大腦疾病分析技術(shù)的進(jìn)步。研究成果發(fā)表在當(dāng)時(shí)影響因子為4.3的JCR 1區(qū)期刊《Medical Image Analysis》上。后期,他又通過三維Gabor小波和高光譜數(shù)據(jù)的卷積,抽取影像每個(gè)像元在空間-光譜聯(lián)合空間內(nèi)的局部變化特性。實(shí)驗(yàn)發(fā)現(xiàn),“多個(gè)不同小波抽取的特征在融合后,能夠很好地代表象元在三維空間內(nèi)的局部信號變化”。后續(xù)工作對三維Gabor特征進(jìn)行了進(jìn)一步篩選,在保持高準(zhǔn)確率的同時(shí),大大提高了系統(tǒng)效率。研究成果陸續(xù)發(fā)表在影響因子為3.5的JCR 1區(qū)期刊《IEEE Transactions on Geoscience and Remote Sensing》。
夢想照進(jìn)現(xiàn)實(shí)
隨著工業(yè)合作的深入發(fā)展,沈琳琳有越來越多的機(jī)會實(shí)現(xiàn)產(chǎn)業(yè)化愿景。2011年,沈琳琳收到一份邀請。這是一家生產(chǎn)醫(yī)用顯微鏡和硬件的公司,其產(chǎn)品主要銷售給醫(yī)院用做疾病診斷,比如驗(yàn)血——加入抗原、抗體后在顯微鏡下觀察不同的反應(yīng),以判斷是否可能出現(xiàn)某種疾病。過去,整個(gè)過程都依靠人工使用顯微鏡,這樣就造成檢測員工作量很大,準(zhǔn)確率和效率也都受到不同程度影響,因此,他們就提出能否有一個(gè)軟件自動(dòng)把反應(yīng)類型分類。
“他們有需求,我們就合作”,沈琳琳接受了這個(gè)挑戰(zhàn)。殊不知,那時(shí)世界上做這類研究的人還很少,因?yàn)樽黾?xì)胞圖像有一個(gè)特點(diǎn)——沒有數(shù)據(jù)做不了研究。沈琳琳因?yàn)楹凸竞献?,就有了獲取圖像數(shù)據(jù)的來源,這樣,他才能順利地做下去。
兩年后,檢驗(yàn)成果的時(shí)刻終于來到。IEEE國際圖像處理會議(ICIP)組織了一場“國際熒光細(xì)胞圖像分類大賽”,沈琳琳延續(xù)先前工作,在詞袋框架下對基于灰度排序的局部特征字典進(jìn)行了研究,通過聚類對密集采樣獲得的局部紋理特征字典進(jìn)行學(xué)習(xí),將在該字典上的表示用直方圖統(tǒng)計(jì)代表整體圖像,最后和空間金字塔方法相結(jié)合用于對顯微鏡觀察到的HEp-2細(xì)胞熒光圖像進(jìn)行自動(dòng)分類。比賽最后,沈琳琳的算法擊敗了來自美國、澳大利亞、日本、法國和意大利著名大學(xué)的13支參賽團(tuán)隊(duì),以最高的準(zhǔn)確率獲得冠軍。研究成果也發(fā)表于模式識別領(lǐng)域知名期刊《Pattern Recognition》 。
漸漸地,沈琳琳的工作走上正軌,他也有了自己的學(xué)生。說起他的第一個(gè)研究生,沈琳琳記憶頗深?!八菍?粕究粕?,基礎(chǔ)不是很好”,但通過3年的努力,最后拿到了一家互聯(lián)網(wǎng)名企公司的錄取單。擁有這樣傲人的成績,除了學(xué)生自身的刻苦,沈琳琳也功不可沒。作為老師,他總是更多的投入精力和時(shí)間去訓(xùn)練學(xué)生,通過帶他們做科研、做項(xiàng)目提升技術(shù)水平。授人以魚不如授人以漁,“在培養(yǎng)其技術(shù)能力的基礎(chǔ)上要有針對性的培養(yǎng)他們獨(dú)立思考,不是把技術(shù)簡單的告訴他,而是教會他如何獲得這個(gè)技術(shù),如何思考、如何解決問題”,表達(dá)與溝通也是他看重的能力。傳道授業(yè),沈琳琳可謂是用心良苦。
回憶起當(dāng)年在上海交大讀碩士,沈琳琳感概道,“那時(shí)還沒有數(shù)據(jù)庫,網(wǎng)絡(luò)也不發(fā)達(dá),查論文很麻煩,只能去圖書館打印”。后來讀博士,一切就都變得方便,他有機(jī)會接近最新技術(shù),同國際學(xué)者交流接觸。以至于到如今,沈琳琳更加珍惜這個(gè)時(shí)代所創(chuàng)造的機(jī)會,可以讓像他一樣有追求有激情的科研者踐行自己的科學(xué)夢。未來,沈琳琳期盼有一個(gè)更大的突破——和公司達(dá)成合作,產(chǎn)品能有更多人使用。
電話那端,沈琳琳的聲音有些低沉,甚至有些疲憊。在沈琳琳看來,科研就是一條一旦選擇了就不能停下腳步的路,唯有源源不斷地探尋下去,才可能看到彼岸的縷縷曙光。然而在路途中,會經(jīng)歷獨(dú)孤、困苦、失望,也會有欣喜與激動(dòng)。這一切都需要自己默默承擔(dān)下,“在未來的某一天,一定會感謝當(dāng)年努力奮斗過的自己。endprint