近日,一款名為ChatGPT的智能聊天機器人“火爆”全網(wǎng),掀起了人工智能(AI)新的浪潮。ChatGPT的厲害之處在哪?除了跟人聊天,AI還在哪些領域表現(xiàn)優(yōu)異?AI會取代人類嗎?……本期,讓我們在一個個具體的應用場景中,感受AI技術(shù)“狂飆”的速度!
同學們,你們了解人工智能嗎?簡單來說,人工智能是研究和開發(fā)能模擬、擴展人類智能的理論、方法、技術(shù)及應用系統(tǒng)的一門新的技術(shù)科學,其研究的目的是促使智能機器會聽、會看、會說、會思考、會學習、會行動。
1956年,約翰·麥卡錫、馬文·明斯基等科學家在美國達特茅斯學院開會研討“如何用機器模擬人的智能”,首次提出“人工智能”這一概念。如今,60多年過去了,以深度神經(jīng)網(wǎng)絡為代表的人工智能技術(shù)飛速發(fā)展,實現(xiàn)了從“不能用、不好用”到“可以用”的技術(shù)突破,在繪畫、文學創(chuàng)作、視頻、音頻等方面不斷帶給人們驚喜。
2022年8月,游戲設計師杰森·艾倫的繪畫作品《太空歌劇院》獲得了新興數(shù)字藝術(shù)家競賽“數(shù)字藝術(shù)/數(shù)字修飾照片”類別一等獎。據(jù)報道,參賽者沒有繪畫基礎,是通過AI繪圖軟件Midjourney耗時80個小時才創(chuàng)作出了該作品。
近年來,AI繪畫成為國內(nèi)外社交網(wǎng)絡爭相討論的熱點話題,各類AI繪畫平臺紛紛涌現(xiàn)。借助AI繪畫軟件,哪怕是繪畫“小白”,只需要動動手指,輸入幾個關鍵詞或直接輸入相關圖片,再選擇自己喜歡的畫風和視角,AI“畫師”便可自動生成一幅筆觸細膩、構(gòu)圖精美的畫作。
AI繪畫本質(zhì)上是通過人工智能算法作畫,其創(chuàng)作過程是AI系統(tǒng)通過學習大量的人類繪畫作品數(shù)據(jù),從而對繪畫產(chǎn)生一定的趨向性認識,繼而從已有的圖像中提取數(shù)字特征,并根據(jù)訓練圖像的風格創(chuàng)建一幅新畫。
這種模式也使AI繪畫無法對最終生成的結(jié)果進行精準控制。在網(wǎng)絡上,類似“狗狗變美女”“男生變女生”等AI繪畫“翻車”現(xiàn)場比比皆是,它們在讓人忍俊不禁的同時,也暴露出AI繪畫距離真正被人類利用還有一段路程要走。
2017年,微軟亞洲研究院研發(fā)的AI“小冰”出版了人類歷史上第一部人工智能詩集《陽光失了玻璃窗》,其中包含139首現(xiàn)代詩;2018年,AI創(chuàng)作的第一部小說1 The Road出版;2022年,谷歌子公司DeepMind發(fā)布劇本寫作模型Dramatron,它能從用一句話表述的戲劇沖突中生成劇本標題、角色、場景、對話;等等——越來越多的AI文學創(chuàng)作案例進入公眾視野。
你們一定會好奇,AI的寫作能力究竟如何?有人在AI中文詩歌自動生成系統(tǒng)——“九歌”上進行了測試。該系統(tǒng)由清華大學團隊研發(fā),由多個專門為中文詩歌生成設計的深度學習模型組成,運用超過30萬首古人詩作進行訓練,支持生成集句詩、絕句、詞等不同體裁的詩歌。
測試者以“池塘”和“春雨”為主題詞,讓“九歌”創(chuàng)作一首五言絕句,系統(tǒng)迅速給出了以下答案:“春雨暗池塘,垂楊扶短墻。月明山色淡,風靜水聲涼?!边@首詩對仗工整,意境優(yōu)美,由此可見,AI創(chuàng)作的詩歌達到了一定的水平。
不過,雖然人工智能可以根據(jù)算法邏輯模仿人類創(chuàng)作出文藝作品,但它無法模擬人類基于歷史經(jīng)驗、生命體驗而產(chǎn)生的情感與意識,更難像人類那樣睹物思人、托物言志。這是目前人工智能無法創(chuàng)作出偉大作品的重要原因。
一提到“AI換臉”,就不得不提Deepfake技術(shù)。Deepfake是由“deep machine learning”(深度機器學習)和“fake photo”(假照片)等意義組合而成的一個詞,可以理解為機器通過深度學習而制造出假照片、假視頻等虛假產(chǎn)物。該技術(shù)最常見的應用就是“AI換臉”,即在視頻中將一個人的臉部移植到另一個人的臉上。
換臉時,機器先要識別出人臉的位置。由于換臉用的素材與待換臉視頻中的人臉的朝向、表情等往往不同,因此,識別出人臉位置后,機器要進一步對人臉進行校準。通過尋找面部具有鮮明特征的區(qū)域,機器可以確定每一幀畫面中人臉的朝向、表情,進而將待換臉視頻中需要插入的人臉與素材匹配。
AI技術(shù)的迅速發(fā)展使得人機交互變得越來越頻繁,“語音合成”作為人機交互中的重要一環(huán),可使人類與計算機的交流更加方便。
語音合成又稱文語轉(zhuǎn)換,是將輸入的文字信息轉(zhuǎn)化為可聽的、連續(xù)的語音,賦予機器“說”的能力。在語音合成技術(shù)領域,國內(nèi)的科大訊飛公司一直保持著領跑者的地位。
目前,科大訊飛通過將發(fā)音內(nèi)容、情感、音色進行解耦,實現(xiàn)了對情感及音色的自由控制并輸出合成語音,讓智能語音更具“人味”。不同的行業(yè)可根據(jù)自身的特點和應用場景進行選擇。如講座類場景可選擇音色穩(wěn)重又有親和力的發(fā)音;面對小朋友,發(fā)音者的音調(diào)可以更加活潑;在新聞播報場景中,有力量感、莊重的聲音則更加合適。
2022年12月,美國人工智能公司OpenAI發(fā)布了自然語言生成式模型ChatGPT,這是一種基于GPT-3(生成式預訓練模型)技術(shù)的聊天機器人,它可以通過人工智能模型來與用戶對話,并自動理解用戶的問題,提供更精確、更有價值的信息。
相比GPT-3,該模型回答問題的方式更加貼近人類,具備記憶能力,可實現(xiàn)連續(xù)對話,同時還具備修改代碼、撰寫論文、詩歌創(chuàng)作等能力。
雖然ChatGPT表現(xiàn)突出,但也引發(fā)了不少爭議。有人認為它會成為高校學生寫論文、考試的“作弊神器”,也有人認為它代表了人機協(xié)同的未來趨勢。
復旦大學計算機科學技術(shù)學院副院長彭鑫表示,ChatGPT可被看作是一個智能助手或一個聰明的秘書,它非常擅長分析、整合既有的知識,并通過人機對話的方式不斷生成文本內(nèi)容?!皡^(qū)別于此前常見的分析決策型AI,如人臉識別,ChatGPT屬于所謂的生成式AI,代表了目前以大數(shù)據(jù)和大算力為基礎的深度學習技術(shù)發(fā)展新高度。”
與其他AI應用一樣,ChatGPT在為用戶提供方便的同時也面臨諸多法律風險和安全、倫理方面的挑戰(zhàn),如何對相關技術(shù)進行監(jiān)管,從而讓人們更好地利用新興技術(shù),是全社會今后需要思考的問題。
小編說:除了以上這些應用,人工智能還在多個領域大放異彩:在交通領域,無人駕駛技術(shù)方興未艾;在醫(yī)療領域,醫(yī)生能在人工智能的輔助下更快、更準確地得出診斷結(jié)果;在家居領域,掃地機器人等已走入尋常百姓家;在教育領域,教師利用人工智能提高教學效率,越來越多的學生了解、學習人工智能相關知識;等等。
值得贊賞的是,有的青少年充分發(fā)揮自己的創(chuàng)造力,發(fā)明出很多與人工智能相關的作品。如長沙市雷鋒中學唐琮浩、謝涵制作的“人工智能交互式飲水機”就曾在第121屆巴黎國際發(fā)明展上斬獲大獎。
相信在未來,人工智能會發(fā)展出一條既能滿足人們需要,又不阻礙人類發(fā)展的路,為我們的生產(chǎn)生活提供更多的便利。
同學們,對于人工智能,你們有哪些憧憬與想象呢?歡迎來信與我們交流。