黃曉燕 劉文昊
摘 要 在最新的2019TIOBE排行榜中,Python語言趕超C++語言穩(wěn)居排行榜第三位,Python語言以崇尚優(yōu)美、清晰、簡單的特性,使得其應(yīng)用者越來越廣泛并且也逐漸得到業(yè)內(nèi)的普遍認(rèn)可。Python語言尤其在解決數(shù)據(jù)科學(xué)任務(wù)與挑戰(zhàn)方面持續(xù)處于領(lǐng)先地位。本文首先闡述了Python語言的發(fā)展歷史與熱門應(yīng)用領(lǐng)域,然后詳細(xì)分析了其在數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)內(nèi)的應(yīng)用與作用,最后研究了Python語言在數(shù)據(jù)科學(xué)方面的重要意義。
關(guān)鍵詞 Python;數(shù)據(jù)分析;人工智能
1Python語言的發(fā)展歷史
Python是一個(gè)高層次的結(jié)合了解釋性、編譯性、互動(dòng)性和面向?qū)ο蟮哪_本語言[1],是由Guido van Rossum在80年代末至90年代初,于Netherlands National Institute of Mathematics and Computer Science設(shè)計(jì)出來的。這門語言本身也吸收了很多不同編程語言的精華,包括ABC、Modula-3、C、C++、Algol-68、SmallTalk、Unix shell和其他的腳本語言等等,發(fā)展到現(xiàn)在,Python以其優(yōu)美、清晰、簡單的特性在全世界內(nèi)廣泛流行,成為最主流的編程語言之一。截至2019年6月,Python在TIOBE流行編程語言排行榜中的排名已經(jīng)上升到第三名,創(chuàng)下了新紀(jì)錄,并且其使用率達(dá)到8.530%,超過C++的7.384%。TIOBE表示,Python之所以排名快速上升,是因?yàn)檐浖こ陶谂畈l(fā)展,而Python作為一門簡潔而有效的編程語言吸引了很多新手進(jìn)入開發(fā)領(lǐng)域。它在過去5年中被選擇率增長最多,達(dá)到了17.6%,并且還在呈增長趨勢。
2Python語言的特點(diǎn)與應(yīng)用
其主要特點(diǎn)如下:第一,Python語言的關(guān)鍵詞比較簡潔,因此其框架基礎(chǔ)、語法規(guī)則等十分清晰,使用時(shí)十分方便。第二,Python語言程序行注釋很明了,因此能夠被輕松閱讀。第三,Python語言的廣泛傳播的主要原因是后臺數(shù)據(jù)是易于調(diào)用且根據(jù)具體需要修改的。第四,Python語言支持引入部分C/C++語言,因此用戶可以方便調(diào)用。第五,Python語言的具備多種內(nèi)庫,并且支持連接外庫,在UNIX、Windows和Macintosh等系統(tǒng)都有其適配的版本。第六,易于調(diào)試,支持放入設(shè)定好的條件并給出程序結(jié)果,同時(shí)支持多次性能試驗(yàn)和運(yùn)行部分程序模塊。第七,因?yàn)镻ython語言有開放的github等平臺,可以在其他相似的項(xiàng)目中直接下載引用。第八,在Python程序中可以直接調(diào)用C或C++完成編程,從而可以保證關(guān)鍵算法的私密性。第九,Python可以直接接入許多主流商業(yè)DB,使用其數(shù)據(jù)。第十,Python可以進(jìn)行GUI編程,能夠在許多版本直接寫入和引調(diào)。
3Python在數(shù)據(jù)分析與大數(shù)據(jù)領(lǐng)域的作用
Python語言是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域主要應(yīng)用語言之一,因?yàn)镻ython在處理大量數(shù)據(jù)時(shí)具有高效率、自動(dòng)化、可運(yùn)用算法建立數(shù)據(jù)模型等特點(diǎn)。傳統(tǒng)的數(shù)據(jù)分析中使用最廣泛的軟件為Excel,但在大數(shù)據(jù)方面,Execl、SPSS等傳統(tǒng)分析軟件無法處理海量數(shù)據(jù)的降維。在計(jì)算量有限時(shí),Excel表格的數(shù)據(jù)處理和Python的計(jì)算維度相似,在當(dāng)計(jì)算量較大或者引入較多復(fù)雜公式時(shí),Excel表格的數(shù)據(jù)處理速度就會變得很慢,而Python對于復(fù)雜計(jì)算的運(yùn)行時(shí)間或迭代次數(shù)會明顯少于Excel表格的數(shù)據(jù)處理時(shí)間。Python具備程序編寫所需要的所有條件,因此,對于大數(shù)據(jù)也十分適用,數(shù)據(jù)分析編程包含的引入數(shù)據(jù)庫、構(gòu)建圖表、建立算法模型等,在Python中都有相應(yīng)的部分與之對應(yīng),可以直接調(diào)用。此外,Python語言在大數(shù)據(jù)處理的應(yīng)用也不可忽視,Python與R相比速度要更快,Python可以直接處理上G的數(shù)據(jù);R分析數(shù)據(jù)時(shí)則需要先通過數(shù)據(jù)庫把大數(shù)據(jù)轉(zhuǎn)化為小數(shù)據(jù)才能交給R做分析,在某些分析領(lǐng)域,Python代替R的趨勢逐漸顯現(xiàn)。
4Python語言的發(fā)展趨勢
隨著科技產(chǎn)業(yè)發(fā)展持續(xù)簡潔化、高科技化,其依賴的底層設(shè)計(jì)必然越來越完整化、細(xì)化,同時(shí)基礎(chǔ)程序的高性能、高兼容、低崩潰就成了對每一個(gè)合格程序腳本的新要求。因此Python語言的第三方庫與開源代碼都會更為簡潔、快速,豐富性也會更高。首先,在未來小工具小程序指數(shù)增加的前提下,無論是大體量的網(wǎng)站架構(gòu)還是小體量的腳本都可以使用Python,這樣在前后端接口的融洽性上會十分有效。一定會同時(shí)醞釀新技術(shù)的革新,從而激發(fā)創(chuàng)造力的噴發(fā);其次,人工智能、深度學(xué)習(xí)的井噴式熱度會越來越高,Python的相關(guān)第三方庫的豐富度會更上一層樓,其應(yīng)用人群也會逐漸擴(kuò)大到絕大多數(shù)研發(fā)工程師、算法工程師、數(shù)據(jù)分析師等職業(yè),成為計(jì)算機(jī)行業(yè)就業(yè)的必備技能;最后,強(qiáng)大的生態(tài)結(jié)構(gòu)決定了其良性循環(huán)的能力,越多的程序員共同開發(fā),行業(yè)的整體效率就越高,因此引入更多的程序員加入,生生不息。
5結(jié)束語
Python由于具有豐富的第三方庫、開發(fā)高效等優(yōu)點(diǎn),已成為數(shù)據(jù)科學(xué)、智能科學(xué)等應(yīng)用領(lǐng)域最流行的編程語言之一,Python強(qiáng)調(diào)了對科學(xué)與工程計(jì)算的支持,目前已積累了豐富的科學(xué)與工程計(jì)算庫和工具。綜上所述,Python編程語言作為基礎(chǔ)語言對從個(gè)人到國家都深有益處,進(jìn)而切實(shí)落實(shí)科技強(qiáng)國的方針政策。在當(dāng)今社會,人工智能和深度學(xué)習(xí)盛行,為了不落后于行業(yè)平均水平,將數(shù)據(jù)化變革引入企業(yè)已經(jīng)成為新的熱門趨勢,這給很多軟件創(chuàng)新帶來新的機(jī)遇,程序員必須具備與之相匹配的能力,如可以建立行業(yè)專用數(shù)據(jù)庫和運(yùn)算庫等專屬編程框架,將至引入github平臺,使其他行業(yè)從業(yè)者也可方便調(diào)用,從而以一點(diǎn)帶動(dòng)整個(gè)行業(yè)進(jìn)步與發(fā)展。這支持了許多行業(yè)的改革換代與加速發(fā)展,這些行業(yè)的發(fā)展會加速社會市場經(jīng)濟(jì)的發(fā)展,從而對數(shù)據(jù)分析行業(yè)帶來正反饋,加速整體社會結(jié)構(gòu)的高科技化轉(zhuǎn)型。
參考文獻(xiàn)
[1] 楊張海,鄭亞卿,王超,等.ArcGIS下基于Python的矢量點(diǎn)在線上拓?fù)浞椒╗J].信息技術(shù)與信息化,2019(5):136-138.