機器學習實戰(zhàn)
《機器學習實戰(zhàn)》是機器學習的人工智能研究領(lǐng)域中一個極其重要的方向之一。在現(xiàn)今大數(shù)據(jù)時代的背景下,捕獲數(shù)據(jù)并從中萃取有價值的信息或模式,使得這一過去為分析師與數(shù)學家所專屬的研究領(lǐng)域越來越為人們矚目?!稒C器學習實戰(zhàn)》通過精心編排的實例,切入日常工作任務(wù),摒棄學術(shù)化語言,利用高效可復(fù)用的Python代碼闡釋如何處理統(tǒng)計數(shù)據(jù),進行數(shù)據(jù)分析及可視化。讀者可從中學到一些核心的機器學習算法,并將其運用于某些策略性任務(wù)中,如分類、預(yù)測及推薦等。
《機器學習實戰(zhàn)》適合機器學習相關(guān)研究人員及互聯(lián)網(wǎng)從業(yè)人員學習參考。
《機器學習實戰(zhàn)》面向日常任務(wù)的高效實戰(zhàn)內(nèi)容,介紹并實現(xiàn)機器學習的主流算法?!稒C器學習實戰(zhàn)》沒有從理論角度來揭示機器學習算法背后的數(shù)學原理,而是通過“原理簡述+問題實例+實際代碼+運行效果”來介紹每一個算法。學習計算機的人都知道,計算機是一門實踐學科,沒有真正實現(xiàn)運行,很難真正理解算法的精髓。這本書的好處就是邊學邊用,非常適合于急需邁進機器學習領(lǐng)域的人員學習。實際上,即使對于那些對機器學習有所了解的人來說,通過代碼實現(xiàn)也能進一步加深對機器學習算法的理解。
《機器學習實戰(zhàn)》的代碼采用Python語言編寫。Python代碼簡單優(yōu)雅、易于上手,科學計算軟件包眾多,已經(jīng)成為不少大學和研究機構(gòu)進行計算機教學和科學計算的語言。相信Python編寫的機器學習代碼也能讓讀者盡快領(lǐng)略到這門學科的精妙之處。
本書作者哈林頓(Peter Harrington)擁有電氣工程學士和碩士學位,他曾經(jīng)在美國加州和中國的英特爾公司工作7年。Peter擁有5項美國專利,在三種學術(shù)期刊上發(fā)表過文章。他現(xiàn)在是Zillabyte公司的首席科學家,在加入該公司之前,他曾擔任2年的機器學習軟件顧問。Peter在業(yè)余時間還參加編程競賽和建造3D打印機。
數(shù)據(jù)挖掘?qū)д?/p>
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫啡娼榻B了數(shù)據(jù)挖掘的理論和方法,旨在為讀者提供將數(shù)據(jù)挖掘應(yīng)用于實際問題所必需的知識?!稊?shù)據(jù)挖掘?qū)д摚ㄍ暾妫泛w五個主題:數(shù)據(jù)、分類、關(guān)聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都包含兩章:前面一章講述基本概念、代表性算法和評估技術(shù),后面一章較深入地討論高級概念和算法。目的是使讀者在透徹地理解數(shù)據(jù)挖掘基礎(chǔ)的同時,還能了解更多重要的高級主題。此外,書中還提供了大量示例、圖表和習題。
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫愤m合作為相關(guān)專業(yè)高年級本科生和研究生數(shù)據(jù)挖掘課程的教材,同時也可作為數(shù)據(jù)挖掘研究和應(yīng)用開發(fā)人員的參考書。
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫肥敲髂崽K達大學和密歇根州立大學數(shù)據(jù)挖掘課程的教材,由于獨具特色,正式出版之前就已經(jīng)被斯坦福大學、得克薩斯大學奧斯汀分校等眾多名校采用。《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫放c許多其他同類圖書不同,《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫穼⒅攸c放在如何用數(shù)據(jù)挖掘知識解決各種實際問題。只要求具備很少的預(yù)備知識——不需要數(shù)據(jù)庫背景,只需要很少的統(tǒng)計學或數(shù)學背景知識。
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫分邪罅康膱D表、綜合示例和豐富的習題,并且使用示例、關(guān)鍵算法的簡潔描述和習題,盡可能直接聚焦于數(shù)據(jù)挖掘的主要概念。
教輔內(nèi)容極為豐富,包括課程幻燈片、學生課題建議、數(shù)據(jù)挖掘資源(如數(shù)據(jù)挖掘算法和數(shù)據(jù)集)、聯(lián)機指南(使用實際的數(shù)據(jù)集和數(shù)據(jù)分析軟件,《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫方榻B的部分數(shù)據(jù)挖掘技術(shù)提供例子講解)。
本書作者陳封能(Pang-Ning Tan)為密歇根州立大學計算機與工程系助理教授,主要教授數(shù)據(jù)挖掘、數(shù)據(jù)庫系統(tǒng)等課程。此前,曾是明尼蘇達大學美國陸軍高性能計算研究中心副研究員。
本書翻譯范明是鄭州大學信息工程學院教授,中國計算機學會數(shù)據(jù)庫專業(yè)委員會委員、人工智能與模式識別專業(yè)委員會委員,長期從事計算機軟件與理論教學和研究。先后發(fā)表論史40余篇。
深入淺出數(shù)據(jù)分析
《深入淺出數(shù)據(jù)分析》以類似“章回小說”的活潑形式,生動地向讀者展現(xiàn)優(yōu)秀的數(shù)據(jù)分析人員應(yīng)知應(yīng)會的技術(shù):數(shù)據(jù)分析基本步驟、實驗方法、最優(yōu)化方法、假設(shè)檢驗方法、貝葉斯統(tǒng)計方法、主觀概率法、啟發(fā)法、直方圖法、回歸法、誤差處理、相關(guān)數(shù)據(jù)庫、數(shù)據(jù)整理技巧;正文之后,意猶未盡地以三篇附錄介紹數(shù)據(jù)分析十大要務(wù)、R工具及ToolPak工具,在充分展現(xiàn)目標知識以外,為讀者搭建了走向深入研究的橋梁。
《深入淺出數(shù)據(jù)分析》構(gòu)思跌宕起伏,行文妙趣橫生,無論讀者是職場老手,還是業(yè)界新人;無論是字斟句酌,還是信手翻閱,都能跟著文字在職場中走上幾回,體味數(shù)據(jù)分析領(lǐng)域的樂趣與挑戰(zhàn)。
“《深入淺出數(shù)據(jù)分析》寫得漂亮,讀者可以學到分析現(xiàn)實問題的系統(tǒng)性方法。從賣咖啡到開橡皮玩具廠,再到要求老板漲工資,此書告訴我們?nèi)绾伟l(fā)現(xiàn)和解密數(shù)據(jù)在日常生活中的強大作用。從圖形圖表到Excel和R計算機程序,《深入淺出數(shù)據(jù)分析》想盡辦法讓各個層次的讀者都體會到系統(tǒng)化的數(shù)據(jù)分析對于制定大大小小的決策的強大作用?!?/p>
——Eric Heilman, 喬治敦預(yù)備學校統(tǒng)計學教師
“被堆積如山的數(shù)據(jù)壓得喘不過氣了?讓Michael Milton做你的老師吧,在辦公工具里添上數(shù)據(jù)分析工具,搶占技術(shù)先機?!渡钊霚\出數(shù)據(jù)分析》將告訴你如何將原始數(shù)據(jù)轉(zhuǎn)變成真正的知識。別再抽簽算卦了——幾套軟件,一本《深入淺出數(shù)據(jù)分析》,就能讓你做出正確的決策?!?/p>
——Bill Mietelski, 軟件工程師
本書作者米爾頓將自己的大半職業(yè)生涯獻給了非營利機構(gòu),幫助這些機構(gòu)解析和處理從贊助人那里收集來的數(shù)據(jù),提高融資能力。多年來,他博覽群書,這些書籍雖字字珠璣,卻枯燥乏味;驀然抬首,深入淺出系列圖書讓他眼前一亮,他欣然抓住機會,走出圖書館和書店,人們會看到他在跑步、攝影,以及親手釀制啤酒。