馬晴
摘要:近年來人工智能機器人開始涉足詩歌寫作領域,試探突破人類創(chuàng)作的最后高地。梳理60年來計算機詩歌寫作程序的發(fā)展階段和生成機制,并結(jié)合實際案例對比考察計算機和人類詩歌創(chuàng)作的異同。研究發(fā)現(xiàn)前者創(chuàng)作速度快、數(shù)量多、方式新,但詩歌詞語搭配呈碎片化,詩行之間缺乏邏輯性,情感意義較為割裂。未來人工智能詩歌創(chuàng)作應提高自然語言處理的語義識別推理能力,加強對詩歌特征和人類思維意識的深度學習,以使機器詩歌真正實現(xiàn)語言美、韻律美與意境美。
關鍵詞:人工智能詩歌;深度學習;微軟小冰;效果;前景
一、前言
自第一臺電子計算機問世以來,計算機能否思考的問題一直與它們是否也可以具有創(chuàng)造性的問題聯(lián)系在一起。當前,人工智能技術不斷迭代更新,已經(jīng)開始浸入人類獨有的能力范疇,擁有計算、感知和認知功能的人工智能,不僅可以勝任自動駕駛、圖像識別、醫(yī)療診斷等工作,而且還具備基于深度學習的語言處理能力,能以創(chuàng)作者的角色進行創(chuàng)作。
詩歌,又稱情感的藝術,素被奉為文學皇冠上的明珠。人工智能詩歌又稱計算機詩歌、機器詩歌,指計算機運用語言技術模型自動生成的原創(chuàng)作品。盡管人工智能詩歌創(chuàng)作正開展得如火如荼,以下問題仍有待思索:機器所作之詩是否確可稱為“詩”?若羅蘭·巴特(Roland Barthes)提及“作者已死”是消解作者的中心化地位,人工智能機器人入侵詩歌創(chuàng)作領域又是否使“詩人已死”加速成為現(xiàn)實?
二、人工智能詩歌創(chuàng)作的發(fā)展歷程
早在半個多世紀前,人類便著手開發(fā)詩歌程序。1959年秋,德國數(shù)學家西奧·盧茨(Theo Lutz)等人利用電腦程序創(chuàng)造了70行詩“隨機文本”(Stochastische Texte),此后一大批人工智能詩歌作品逐漸涌現(xiàn)??傮w而言,計算機詩歌創(chuàng)作經(jīng)歷了以下三個發(fā)展階段:20世紀60、70年代的起步階段、20世紀80、90年代的高速發(fā)展階段、21世紀以后的跨越式發(fā)展階段。
20世紀60、70年代,智能詩歌創(chuàng)作程序在歐美國家應運而生。1962年,美國精密儀器工程師沃西(R. M. Worthy)等人研制出機器詩歌軟件“Auto-beatnik”(埃比)。兩年后,語言工程領域先驅(qū)讓·博多(Jean Baudot)等人開發(fā)機器詩歌寫作程序,并于加拿大發(fā)表了全球首部由計算機撰寫的自由體詩集《機器寫作》(La Machine à écrire)。1973年,美國人理查德·拜萊(Richard W. Bailey)出版了計算機生成的詩選《計算機詩歌》(Computer Poems),并在導言中指出機器詩歌是通過其他方式針對人們按部就班的語言習慣發(fā)起的一場戰(zhàn)爭[1]。
20世紀80、90年代,人工智能詩歌創(chuàng)作邁向高速發(fā)展期。歐美以外的國家和地區(qū)也開始關注機器詩歌寫作,且軟件開發(fā)人員不再僅限于專業(yè)人士。1984年,年僅14歲的上海中學生梁建章以《唐詩三百首》和《千新詩注》為數(shù)據(jù)藍本,使用Apple Ⅱ微機開發(fā)出計算機詩詞創(chuàng)作軟件。1989年,科幻作家劉慈欣利用編程開發(fā)“電子詩人”,用戶只要根據(jù)需求設置好段數(shù)、行數(shù)、韻腳等信息,即可隨機獲得一首完整的現(xiàn)代詩。1999年,網(wǎng)名為“稻香老農(nóng)”的福建網(wǎng)友林鴻程在個人網(wǎng)站發(fā)布“稻香居”作詩機,至今已被網(wǎng)友使用超過一億次。
21世紀以來,機器生成的詩歌創(chuàng)作進入跨越式發(fā)展階段。2013年百度App推出“為你寫詩”功能,用戶僅需要輸入任意一張圖片,即可獲得一首機器生成的短詩。2016年以后,隨著深度學習的普及,一批基于神經(jīng)網(wǎng)絡算法模型的詩歌自動生成軟件開始進入大眾視野。筆者統(tǒng)計了5款詩歌自動生成機器,其學習庫和功能見表1。
三、人工智能詩歌創(chuàng)作的生成機制
起步階段的人工智能詩歌生成系統(tǒng)利用規(guī)則和模板限定語法和語義的通暢。模板固定了生成詩歌中的某些詞匯或短語片段,其余片段則留出空白用以填充,且附有詞性、時態(tài)等信息,大多為實詞,如名詞、動詞、形容詞,偶爾也填充副詞。計算程序從詞典中隨機選擇符合條件的詞進行填充[2]。最早的機器詩歌“隨機文本”就是由開發(fā)者從弗朗茨·卡夫卡(Franz Kafka)的小說《城堡》(The Castle)中選擇了16個名詞和16個形容詞,并添加了4個連詞和4個代詞作為素材,然后對單詞元素通過數(shù)學元素進行重組,以創(chuàng)建出4174304個不同的句子,最后從所有可能的組合中摘錄程序在某一分鐘內(nèi)的生成結(jié)果。另一位“自動詩人”埃比在創(chuàng)作詩歌時,同樣基于規(guī)則和模板,首先將“學習”的3500個詞依照詞性分為幾組,見表2。
然后根據(jù)程序員的指令,按照一定的句法結(jié)構隨機從每一縱行中選詞,譬如按照4-1-2-4-3-1的格式選詞會得到句子“The flower is a red bridge.”(這朵花是一架紅色的橋)。此類設置可以保證“機器詩人”創(chuàng)作的詩行既符合英語句法規(guī)則,又極具內(nèi)容隨機性。1964年出版的《機器寫作》一書的附錄中也闡述了基于規(guī)則的計算機詩歌寫作步驟:即機器首先開發(fā)符合語法規(guī)則的短語邏輯元素結(jié)構,其次測定上述元素的類型、數(shù)量或時間,最后從詞典中選擇詞以構造由句法結(jié)構定義的句子。這三個階段完全由計算機通過數(shù)學運算模擬機會法則隨機執(zhí)行[3]。盡管基于規(guī)則和模板生成的詩歌符合語法規(guī)范,但整個過程在很大程度上仍然依賴于人工模板的設計,因此創(chuàng)作出的詩歌較為死板,缺乏靈活性。
20世紀80、90年代,人工智能詩歌生成系統(tǒng)逐漸演變?yōu)榛谠O定模式的方法。與基于模版的方法相同,這類系統(tǒng)通常有事先設定的模式,不同的是模式的靈活性遠大于模版[4]。劉慈欣利用編程開發(fā)的“電子詩人”就是將大量詞匯按照預先設定的格律韻腳進行隨機排列組合。作品第75509號中的部分詩句如下“我面對著光燦燦的冬雪和雙曲線形的霞光/我看到,青色的乳房在漂蕩,肥皂在聆聽著海象/在這弱小的春雨中,沒有貝多芬,只有母親/我想上升,我想呼吸著地歌唱?!北M管基于設定模式生成的詩歌讀起來韻律感更強,但語義之間還是缺乏連貫性,存在主題漂移的問題。
為了解決這一問題,人工智能詩歌創(chuàng)作系統(tǒng)開始采用最新的深度學習和神經(jīng)網(wǎng)絡技術。譬如清華大學的九歌詩歌生成程序就采用了基于循環(huán)神經(jīng)網(wǎng)絡(RNN)語言模型的方法[5]。2018年5月,微軟公司的機器人小冰生成詩歌已經(jīng)升級到基于深度神經(jīng)網(wǎng)絡(DNN)的圖像模型方法,該方法依賴計算機視覺和自然語言生成技術,系統(tǒng)首先從圖像中提取出情感關鍵詞,然后根據(jù)學習庫中的已有詩歌,將提取出的關鍵詞過濾和拓展為關鍵詞集,繼而將關鍵詞集中的每個詞都重新定義為詩中每個句子的初始種子,利用神經(jīng)網(wǎng)絡逐步生成詩歌,最后借助自動評估器選擇質(zhì)量良好的句子。
綜上所述,人工智能詩歌的生成機制歷經(jīng)三個發(fā)展階段:早期利用模板和規(guī)則生成的詩歌僅能保證句子符合語法的要求,中期基于設定模式生成的詩歌更加精確,但在語義性和詩性上仍有所欠缺,當前基于深度學習和神經(jīng)網(wǎng)絡技術的詩歌生成方法原理上有較大提高,但實際效果究竟如何呢?
四、人工智能詩歌創(chuàng)作的效果評價
微軟小冰于2017年5月公開出版的詩集《陽光失了玻璃窗》是人工智能文學創(chuàng)作領域的一大重要突破,但誠如微軟全球副總裁、“小冰之父”沈向洋所言“我們相信,不同的讀者能從中品味出不同的感受:科技領域的同仁們或許更加重視小冰語言生成模型的優(yōu)美,文化領域的朋友們或許會更加關注作品字里行間的情感,發(fā)現(xiàn)她仍然稚嫩和青澀。”[6]縱觀該詩集,標題即體現(xiàn)出非邏輯之處,其中動詞“失了”著實令人不解。而詩集內(nèi)突兀怪誕的表達也俯拾皆是,如“以代代你明媚的眼睛”(《道上沒有一點點的燈》)、“那一滴流綠衣的好人”(《我怕驚醒那屋頂上的青藤》)……如果說諸如此類看似詭異荒誕的碎片化語詞搭配是一種后現(xiàn)代拼貼式的創(chuàng)新,那么詞匯、句子和段落之間邏輯關聯(lián)性的缺失,則必然會阻礙詩歌意境的銜接、意義的連貫和情感的抒發(fā)。筆者登錄小冰的官網(wǎng)(https://poem.xiaoice.com/),上傳了一張雨云的圖片,并在提示文字中標注“雨云”,最終生成篇幅不一的三首詩。筆者隨機選取其中一首:
流水是自由的/不見雨水只是巨大的屠場/也許這就是夢中的幻境
是昨夜夢里的光景一樣/還不能放進天空的虛幻/魔鬼們不是這生命的歷史
為什么的流水系在你的身旁/濃香的人們打不破的空虛
小冰創(chuàng)作的詩歌雖然捕捉到了圖片中的重要意象,如“雨水”“天空”等,但更為關鍵的“云”卻始終沒有出現(xiàn),而“濃香的人們”這類語詞搭配還是一如既往的怪誕。就整體而言,小冰創(chuàng)作的詩歌各意象、各意境之間呈現(xiàn)出跳躍式的排列方式:第一節(jié)描述夢中的雨水,第二節(jié)仍在重復表述這是夢中的場景,第三節(jié)以問答告終,用“空虛”收尾。盡管全詩在不同詩行多次出現(xiàn)“夢”“流水”“虛幻”等意象,但上述意象的組合卻無益于抒發(fā)詩人的情感??傮w而言,整首詩歌的前后文關聯(lián)不足,因此導致主題漂移,詩意性較差。為了使檢驗效果更具說服力,筆者選取我國著名詩人、翻譯家屠岸先生于1990年所作同一主題詩歌(《雨云》)進行對比。
陽光從云隙射下,云塊奔馳,/山水間,明暗交錯,天地浮動……/烏云驟起,疾風勁吹,老樹枝/抓住懸崖,仍不免被卷入虛空。
遠處,峻嶺之上,黑云成條狀,/垂直如巨帶,橫掃廣袤的大地。/“呵,那邊正在下暴雨!”你講。/云送雨點來。奔大壩,挨石檐暫避
回首看西方,烏云拖兩條灰須/拂過田野,漸隱。哦!從遠方/看此處煙雨,該也是云的圓柱/豎在大地上。須臾,天日重光——
湖山如洗,夕陽似火。你卻說,/“看,錦云的背后,是大雨滂沱!”
就形式而言,屠岸先生受翻譯莎士比亞十四行詩的影響,在創(chuàng)作中采用歐洲抒情十四行(sonnet)詩體,格律嚴謹,讀起來朗朗上口。就內(nèi)容而論,全詩緊扣“雨云”這一脈絡,三個四行詩節(jié)分別描繪了雨前、雨中、雨后的景象,極為生動形象地借云的變化描述了下雨的全過程。最為精彩的是全詩的最后一句“錦云的背后是大雨滂沱”,留給人極為豐富的想象空間,引申為人生的成功也要經(jīng)歷風吹雨打。正如詩人鄭敏所評價的,“在嚴守十四行詩的格律要求之下,詩人能從容地以相當樸實的詩歌語言,傳達出值得讀者深思的奧義?!盵7]
總體而言,小冰的詩歌更像是將已有詩句和詞語進行的置換與組合,語詞流暢和陌生之間的度掌握并不佳,意象搭配和邏輯明顯遜色于人類創(chuàng)作的詩歌,遑論詩歌創(chuàng)作更珍貴的韻律、意境與情感。
五、人工智能詩歌創(chuàng)作的前景展望
人工智能創(chuàng)作出的詩歌語言是一種“語言生成模型”的產(chǎn)物,因此難免有模板化的特點。目前弱人工智能下的機器詩歌創(chuàng)作依賴于海量數(shù)據(jù),內(nèi)容呈現(xiàn)出機械性復制和材料堆砌。不同于人類本有的豐富閱歷和生活經(jīng)驗,機器詩歌創(chuàng)作缺乏主體性和作詩的動機,只是不斷模仿數(shù)據(jù)庫中的語言,脫離了人文社會科學背景,使意義和情感大打折扣。上文中提到的《陽光失了玻璃窗》是情感計算的人工產(chǎn)品,如果出現(xiàn)一些漂亮的詩句,證明的是情感計算的精確程度,而非情感抒寫的藝術高度;小冰可以寫出抒情的詩句,但卻極難寫出表達意義深度的詩歌意象[8]。比如人類詩歌創(chuàng)作中常出現(xiàn)的隱喻,在人工智能詩歌創(chuàng)作中就不曾存在,因此有學者認為計算機創(chuàng)作的詩歌至多能被稱作“類詩”。
此外,人工智能雖然已經(jīng)可以從外在形式上模擬詩歌式的語言,但是詩歌語言的基礎——日常語言建基于具體的生活環(huán)境,由此產(chǎn)生的語境問題是人工智能無法解決的難題[9]。為了解決這一問題,未來的智能詩歌創(chuàng)作程序應該基于網(wǎng)絡大數(shù)據(jù),為人工智能機器人搭建“生活環(huán)境”,即建立人工智能語料庫。深度學習的發(fā)展使得人工智能有可能模擬人類大腦皮層的活動,進而以一種類似于人類的方式學習和思考[10]。未來還要進一步提高自然語言處理的語義識別和推理能力,使人工智能朝縱深發(fā)展,真正模擬人的思想和意識,而非單純模仿和拼貼人類語言。
盡管人工智能詩歌創(chuàng)作在意象搭配、意境營造、情感流動以及詩歌韻律等方面不能盡善盡美,機器詩歌的創(chuàng)作優(yōu)勢卻仍然不容小覷。人工智能詩歌的創(chuàng)作效率極高,能夠永不停歇地無限學習語料庫中的新內(nèi)容,快速創(chuàng)作出海量新作品,創(chuàng)作過程也更新穎。智能詩歌創(chuàng)作卻將讀者和詩人拉向共時平面:在小冰的程序頁面中,原本看不見的“創(chuàng)作思路”被顯現(xiàn)于讀者視覺之前,讀者既可以看到賦予其創(chuàng)作靈感的視覺畫面,又可以讀到它創(chuàng)作的詩歌,這是人類詩歌作品中幾乎看不見的形式。事實上,機器詩歌的生成過程離不開人類智慧決定性的介入。因此我們也應該轉(zhuǎn)變思路,不再將人工智能詩歌視作人類詩歌的對立面,而是將其視為人類詩歌發(fā)展的助推器。人工智能學習的語料可以賦予人類更多的創(chuàng)作靈感,人類也可以在機器詩歌創(chuàng)作的基礎上完成二度創(chuàng)作。詩歌創(chuàng)作沒有一成不變的準則,優(yōu)秀的詩歌作品正是人類思想和智慧的結(jié)晶,凸顯了人類因個體差異造就的對社會的多樣感知和反饋,這些遠非公式能夠計算。強人工智能到來之前,機器詩歌創(chuàng)作的進步還有很長的路要走。
六、結(jié)語
人工智能詩歌創(chuàng)作歷經(jīng)60年變遷,背后的原理機制不斷優(yōu)化:從20世紀60年代基于模板和規(guī)則,到80、90年代基于設定模式,再到21世紀后基于神經(jīng)網(wǎng)絡和深度學習的方法,智能詩歌似乎愈來愈符合語法規(guī)范和詩歌形態(tài)。但對比微軟小冰和詩人屠岸先生創(chuàng)作的詩歌可以發(fā)現(xiàn),機器詩歌的效果仍不能完全盡如人意。未來的人工智能詩歌創(chuàng)作應該進一步提高處理詞義之間的隱喻邏輯、句子之間的語義邏輯、全詩蘊含的情感邏輯等方面的能力。而詩人也可以更充分地利用大數(shù)據(jù)和語料庫的便利性,汲取創(chuàng)作靈感,完善創(chuàng)作技巧。
參考文獻
[1]Richard,W. Bailey, ed. Computer Poems[M]. Drummond Island, MI: Potagannissing Press, 1973.
[2]Gervás, P. Exploring Quantitative Evaluations of the Creativity of Automatic Poets[A]. In Tony Veale, F. Amílcar Cardoso (ed.). Computational Creativity[C].Berlin: Springer, 2019: 275-304.
[3] Baudot, Jean A., ed. La Machine à écrire[M]. Montreal: ?ditions Du Jour, 1964: 93-94.
[4]中國人工智能學會編.中國人工智能進展2007[M].北京:北京郵電大學出版社,2007.
[5]陳雪.清華大學孫茂松:人工智能是怎樣寫詩的?
[EB/OL].https://view.inews.qq.com/a/20220526A08L0800?refer=wx_hot,2022-05-26.
[6]小冰.陽光失了玻璃窗[M].北京:北京聯(lián)合出版公司,2017.
[7]鄭敏.屠岸的十四行詩[J].詩探索,2011(01):28-31.
[8]謝雪梅.文學的新危機——機器人文學的挑戰(zhàn)與后人類時代文學新紀元[J].學術論壇,2018,41(02):14-20.
[9]陶鋒.人工智能文學的三重挑戰(zhàn)[J].天津社會科學,2023,248(01):155-159.
[10]程羽黑.人工智能詩歌論[J].華南師范大學學報(社會科學版),2019(05):178-182+192.
作者單位:南開大學外國語學院