郭毅可 教授上海大學(xué)計(jì)算機(jī)工程與科學(xué)學(xué)院院長倫敦帝國理工學(xué)院數(shù)據(jù)科學(xué)研究所所長上海產(chǎn)業(yè)研究院大數(shù)據(jù)首席科學(xué)家
走好我們的大數(shù)據(jù)之路
郭毅可教授
上海大學(xué)計(jì)算機(jī)工程與科學(xué)學(xué)院院長
倫敦帝國理工學(xué)院數(shù)據(jù)科學(xué)研究所所長
上海產(chǎn)業(yè)研究院大數(shù)據(jù)首席科學(xué)家
2015年10月21日上午10點(diǎn)15分,習(xí)近平主席偕夫人訪問了倫敦帝國理工學(xué)院數(shù)據(jù)科學(xué)研究所.作為研究所所長,我向習(xí)主席演示了我和我們團(tuán)隊(duì)的一些研究成果.
(1)與浙江大學(xué)合作的對(duì)中國人口遷移狀況的分析.對(duì)五年中近一百萬個(gè)流動(dòng)人口家庭的數(shù)據(jù)和中國各省人口的流動(dòng)狀況進(jìn)行了細(xì)致的分析.分析包括各省流動(dòng)人口的特征、相關(guān)政策對(duì)流動(dòng)人口的影響,以及流動(dòng)人口對(duì)中國城鎮(zhèn)化的影響等.
(2)與維也納國際應(yīng)用系統(tǒng)分析研究所、美國大氣研究中心和上海大學(xué)合作的有關(guān)“一帶一路”戰(zhàn)略的國際影響力分析.用人口學(xué)理論和社會(huì)發(fā)展模型,以及對(duì)過去50年間各國社會(huì)與經(jīng)濟(jì)發(fā)展數(shù)據(jù)和基礎(chǔ)建設(shè)數(shù)據(jù)的綜合分析,來預(yù)測(cè)未來30~80年間“一帶一路”沿線國家的人口發(fā)展.
(3)與英國國家基因組計(jì)劃、歐盟創(chuàng)新制藥計(jì)劃的合作研究.展示了一個(gè)基于個(gè)性化醫(yī)療的實(shí)用臨床系統(tǒng),可以根據(jù)每個(gè)人的基因以及其他分子醫(yī)學(xué)數(shù)據(jù)對(duì)疾病進(jìn)行個(gè)性化分析,從而提出精確治療方案.
(4)與上海地鐵的合作項(xiàng)目.利用上海地鐵每天每個(gè)乘客的進(jìn)出站數(shù)據(jù),來分析各條地鐵線路的負(fù)載情況.同時(shí),對(duì)各種故障情況下地鐵線路負(fù)載的重新分配進(jìn)行預(yù)測(cè).從而對(duì)整個(gè)地鐵線路的可靠性和安全性進(jìn)行評(píng)估.
習(xí)主席對(duì)這些工作表示贊賞.他認(rèn)為,用大數(shù)據(jù)作交叉學(xué)科研究很有意義,與實(shí)際應(yīng)用相結(jié)合是個(gè)好方向.習(xí)主席的這些話肯定了我們對(duì)大數(shù)據(jù)的研究方向的思考和策略,使我們倍受鼓舞.
我們秉承著“研究先進(jìn)大數(shù)據(jù)管理和分析技術(shù),并以此來促進(jìn)數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究及技術(shù)發(fā)展,造福人類社會(huì)”的宗旨,在以下六個(gè)方面做出了許多努力,取得了很多令人矚目的成果:一是作為交叉學(xué)科發(fā)展樞紐,組織并推進(jìn)以大數(shù)據(jù)為基礎(chǔ)的多學(xué)科合作;二是培養(yǎng)新一代有創(chuàng)新能力的數(shù)據(jù)科學(xué)家;三是為數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究提供技術(shù)與設(shè)施的支持;四是與全世界工業(yè)界和學(xué)術(shù)界廣泛展開大數(shù)據(jù)科研合作;五是促進(jìn)數(shù)據(jù)經(jīng)濟(jì)、數(shù)據(jù)產(chǎn)品與產(chǎn)業(yè)的創(chuàng)新;六是向政府、公共管理機(jī)構(gòu)及全社會(huì)提供有關(guān)大數(shù)據(jù)的政策與技術(shù)咨詢.這次習(xí)主席的來訪是中英雙方對(duì)我們工作的一種肯定,我們深感榮幸與自豪.
大數(shù)據(jù)為人類社會(huì)提供了又一次新的資源機(jī)遇.這種新資源具有人類已有自然資源所不具備的許多特征.如超可再生性,即數(shù)據(jù)的使用本身并不消耗數(shù)據(jù),相反還會(huì)產(chǎn)生新的數(shù)據(jù);非競(jìng)爭(zhēng)性使用,即一方對(duì)數(shù)據(jù)的占有并不限制其他人對(duì)這份數(shù)據(jù)的擁有.這些特征使得數(shù)據(jù)資源的使用不僅可以像其他自然資源一樣產(chǎn)生能量與財(cái)富,而且可以完全改變?nèi)祟惖纳鐣?huì)組織結(jié)構(gòu)和行為方式.因此,對(duì)數(shù)據(jù)科學(xué)必須站在社會(huì)發(fā)展、新的經(jīng)濟(jì)模式、新的工業(yè)體系、新的創(chuàng)新產(chǎn)品、新的生活方式以及新的科學(xué)研究方法等宏觀角度來進(jìn)行系統(tǒng)化研究.那種僅僅把數(shù)據(jù)科學(xué)作為統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)的分支應(yīng)用,把機(jī)器學(xué)習(xí)和大數(shù)據(jù)管理技術(shù)等數(shù)據(jù)科學(xué)的具體技術(shù)作為數(shù)據(jù)科學(xué)的主要內(nèi)涵的思路與做法,未免是太狹隘了.
一個(gè)數(shù)據(jù)科學(xué)的典型而現(xiàn)實(shí)的例子就是當(dāng)今的醫(yī)學(xué).近20年來,高通量的醫(yī)學(xué)儀器使得人類對(duì)生命的觀察達(dá)到了分子級(jí)的精度.今天,我們不僅可以準(zhǔn)確地讀出每個(gè)人的基因序列,而且還可以對(duì)細(xì)胞中分子的活動(dòng)進(jìn)行實(shí)時(shí)檢測(cè).這些分子級(jí)的通過對(duì)生命的觀察而產(chǎn)生的大數(shù)據(jù),是對(duì)每個(gè)人每一刻生命活動(dòng)的度量,從而使得醫(yī)學(xué)成為一種基于這種度量,對(duì)生命進(jìn)行有效調(diào)控的精準(zhǔn)科學(xué).正因?yàn)槿绱耍瑪?shù)據(jù)科學(xué)是當(dāng)今醫(yī)學(xué)發(fā)展的一個(gè)重要基礎(chǔ).同時(shí),醫(yī)學(xué)應(yīng)用也對(duì)數(shù)據(jù)科學(xué)提出了許多有意義的挑戰(zhàn)和研究方向.醫(yī)學(xué)數(shù)據(jù)科學(xué)本身就成為了一門具有巨大社會(huì)價(jià)值及科學(xué)意義的大學(xué)科.我們?cè)谏虾.a(chǎn)業(yè)研究院的生物信息學(xué)中心的研究也正在朝這個(gè)方向努力.
數(shù)據(jù),顧名思義就是以數(shù)為據(jù),是對(duì)物理世界的觀察與度量.對(duì)這樣的數(shù)據(jù)作分析,得到具有普遍意義的總結(jié),并且對(duì)這個(gè)總結(jié)中的誤差和非確定性進(jìn)行估計(jì)和界定,是數(shù)據(jù)科學(xué)的基本方法.然而,這種統(tǒng)計(jì)方法的有效應(yīng)用離不開對(duì)物理世界本身規(guī)律的理解,這也就是我們常說的觀察前的先驗(yàn)知識(shí).這種被稱為貝葉斯方法的數(shù)據(jù)科學(xué)原則,實(shí)際上充分反映了數(shù)據(jù)科學(xué)和領(lǐng)域科學(xué)融合研究的重要性與必要性.
數(shù)據(jù)作為資源,其巨大的經(jīng)濟(jì)價(jià)值已經(jīng)充分體現(xiàn).但是由于數(shù)據(jù)資源的特殊性,當(dāng)數(shù)據(jù)作為資產(chǎn)時(shí),這樣的資產(chǎn)有很特殊的性質(zhì).因此,對(duì)數(shù)據(jù)資產(chǎn)的定價(jià)和交易是很有意義的經(jīng)濟(jì)學(xué)命題,而對(duì)這些命題的研究本身就是數(shù)據(jù)科學(xué)的一個(gè)重要內(nèi)容.我們?cè)谶@方面進(jìn)行了許多開創(chuàng)性的工作,如數(shù)據(jù)交易的理論和技術(shù)、比特幣等未來數(shù)據(jù)貨幣和數(shù)據(jù)遺產(chǎn)等.最近,我們與中國建銀國際和深圳鍵橋通訊合作成立了數(shù)據(jù)經(jīng)濟(jì)研究實(shí)驗(yàn)室,以進(jìn)一步推動(dòng)對(duì)數(shù)據(jù)經(jīng)濟(jì)的研究和創(chuàng)新.
數(shù)據(jù)資源和數(shù)據(jù)資產(chǎn)都具有很強(qiáng)的社會(huì)性,它們與人類生活本身息息相關(guān),因此在數(shù)據(jù)科學(xué)研究中,社會(huì)科學(xué)和數(shù)據(jù)科學(xué)的融合具有極重要的地位.特別是對(duì)法律、倫理以及數(shù)據(jù)化社會(huì)中的社會(huì)結(jié)構(gòu)發(fā)展與變化都有很重要的現(xiàn)實(shí)意義.在英國,我們數(shù)據(jù)科學(xué)研究所和倫敦政治經(jīng)濟(jì)學(xué)院在這方面有廣泛的合作.在上海大學(xué),計(jì)算機(jī)工程與科學(xué)學(xué)院和社會(huì)科學(xué)研究院系也開展了這方面的合作研究.
綜上所述,我們對(duì)大數(shù)據(jù)的研究正方興未艾,國家也把大數(shù)據(jù)研究與發(fā)展作為國家戰(zhàn)略.走好我們的大數(shù)據(jù)之路既是我們今天的事業(yè),也是我們的責(zé)任.走好大數(shù)據(jù)之路的關(guān)鍵是要有寬廣的戰(zhàn)略胸懷,把大數(shù)據(jù)真正作為當(dāng)今社會(huì)與經(jīng)濟(jì)發(fā)展的驅(qū)動(dòng)力,使我們能夠把先進(jìn)的技術(shù)研究和廣泛的社會(huì)實(shí)際應(yīng)用緊密結(jié)合,直接造福人類.
在大數(shù)據(jù)之路上只有創(chuàng)新,沒有跟隨!
10.3969/j.issn.1007-2861.2015.05.016