王帆
南京藝術(shù)學(xué)院,南京210013
在科技革命的社會(huì)語(yǔ)境下,人們所熟知的字體行業(yè)正在發(fā)生變化,字體設(shè)計(jì)在全球市場(chǎng)上運(yùn)作,字體應(yīng)用在跨文化環(huán)境中延續(xù)。隨著新視野的打開,技術(shù)機(jī)遇向人們展示了字體設(shè)計(jì)的創(chuàng)新能力。
技術(shù)進(jìn)步改善了幾乎所有行業(yè)的工作流程,并悄然滲透到創(chuàng)意領(lǐng)域的脈絡(luò)中,字體設(shè)計(jì)師已不再根據(jù)自己的藝術(shù)感覺塑造單個(gè)字形,而是越來(lái)越廣泛地使用編程算法、參數(shù)化方法,并將這些工具提煉成一個(gè)設(shè)計(jì)系統(tǒng)來(lái)定義整批字體的屬性,從而實(shí)現(xiàn)工作流程的自動(dòng)化。
編程作為一種工作方式,是設(shè)計(jì)系統(tǒng)的催化劑。如今,設(shè)計(jì)師將工作轉(zhuǎn)向?yàn)殚_發(fā)小型工具或系統(tǒng),而不是設(shè)計(jì)模擬數(shù)字的“一次性產(chǎn)品”。與非程序化的結(jié)果相比,設(shè)計(jì)師的決策或系統(tǒng)的規(guī)則,在制定的腳本中變得更加清晰。韓國(guó)設(shè)計(jì)師安汝賢(Yeohyun Ahn)[1]開發(fā)的字體設(shè)計(jì)研究項(xiàng)目“字體+代碼(Type+Code)”(見圖1),在其第二系列中,她通過(guò)使用數(shù)學(xué)表達(dá)式、計(jì)算機(jī)算法(二叉樹算法、L 系統(tǒng)算法等),以“控制論生態(tài)學(xué)”的圖形表現(xiàn)形式,探索了實(shí)驗(yàn)性、代碼驅(qū)動(dòng)的字體設(shè)計(jì)美學(xué)。中國(guó)設(shè)計(jì)師郭銳文(Raven Kwok)[2]在他的作品“偉大(Greatness)”(見圖2),中利用Voronoi曲面細(xì)分作為核心元素,通過(guò)Processing 編程定制生成系統(tǒng)的多個(gè)變體建構(gòu)了拉丁文字體的輪廓。此外,他還將計(jì)算機(jī)程序算法在視覺美學(xué)表達(dá)上的可能性拓展到了中文字體設(shè)計(jì)領(lǐng)域。他利用從字體文件中提取的字形數(shù)據(jù),為丁卯點(diǎn)陣體、行楷Next 體和基本美術(shù)體這三種中文字體實(shí)現(xiàn)了獨(dú)特的視覺風(fēng)格和互動(dòng)體驗(yàn)。
圖1 安汝賢的算法字體設(shè)計(jì)項(xiàng)目“字體+代碼”部分作品
圖2 郭銳文的拉丁文及中文算法字體設(shè)計(jì)作品
生成系統(tǒng)深深植根于平面設(shè)計(jì)的歷史背景之中,字體設(shè)計(jì)領(lǐng)域一直由系統(tǒng)化的技術(shù)驅(qū)動(dòng)流程所定義。將遞歸性用于字體生成是《模擬算法:源相關(guān)網(wǎng)格系統(tǒng)》(Analog Algorithm: Source-Related Grid Systems)(見圖3)的核心原則,設(shè)計(jì)師克里斯托夫·格林伯格(Christoph Grünberger)[3]詳細(xì)描述了從形式分析到設(shè)計(jì)規(guī)則的制定及應(yīng)用過(guò)程,首先在比例網(wǎng)格的基礎(chǔ)上創(chuàng)建一個(gè)顯示字體示例,然后通過(guò)對(duì)字體形式矩陣所有可能的排列方式進(jìn)行理論上完整迭代,這種方法強(qiáng)調(diào)了形式賦予是一個(gè)發(fā)現(xiàn)的過(guò)程。而《字母變體》(Letterform Variations)(見圖4)中,所有字體生成均來(lái)自一個(gè)使用基本網(wǎng)格和形狀系統(tǒng)構(gòu)建的視覺框架,設(shè)計(jì)師奈杰爾·科蒂埃(Nigel Cottier)[4]設(shè)計(jì)了兩部分內(nèi)容,A部分為原始完整字符集,B部分為原始完整字符集的9種變體。每個(gè)字母變體字符集包含兩個(gè)已定義的權(quán)重,共計(jì)19 840個(gè)字符。此外,每個(gè)字符集都創(chuàng)建了一個(gè)可變字體文件,允許顯示兩個(gè)字符集之間的任何權(quán)重,從而創(chuàng)造出無(wú)窮無(wú)盡的變體字形。這種方法部分基于算法函數(shù)生成的視覺轉(zhuǎn)換,例如約束、規(guī)則、網(wǎng)格和模塊;部分基于設(shè)計(jì)師對(duì)構(gòu)圖、平衡和視覺動(dòng)態(tài)的判斷??频侔5哪K化系統(tǒng)建立在廣闊的設(shè)計(jì)空間內(nèi),便于產(chǎn)生無(wú)限的輸出,但他隨后做出了深思熟慮的選擇,將結(jié)果分類并編輯成一種系統(tǒng)化的語(yǔ)言編碼?!俺绦蛐浴被颉吧尚浴笔撬惴▽?duì)輸出至關(guān)重要的另一種說(shuō)法。“生成字體(Generative Fonts)”(見圖5),是一個(gè)程序生成的顯示字體以及其代碼庫(kù)的集合,它的設(shè)計(jì)者盧克·普勞斯(Luke Prowse)認(rèn)為,算法只是設(shè)計(jì)的另一種表達(dá),其中很多想法都始于紙上,然后被逆向工程轉(zhuǎn)化為一個(gè)系統(tǒng),其中不乏一絲隨機(jī)性。該項(xiàng)目的創(chuàng)作流程分為三個(gè)步驟,首先,所有腳本都需要輸入字體作為修改的基礎(chǔ);其次,所有腳本都在GlyphsApp 中的輸入字體上執(zhí)行,GlyphsApp 提供共享代碼庫(kù),因此可以修改現(xiàn)有參數(shù)或創(chuàng)建自己的參數(shù)作為獨(dú)特腳本;最后,腳本會(huì)根據(jù)所選字形或整個(gè)字形集生成輪廓輸出字體。德卡斯特里奧算法(De Casteljau's algorithm)是該項(xiàng)目的基礎(chǔ),它可以與判別點(diǎn)在多邊形內(nèi)算法(Pointin-Polygon Algorithm)相匹配,搭載創(chuàng)意編程創(chuàng)建一種系統(tǒng)框架來(lái)解決一些比較棘手的常見問(wèn)題,從而讓設(shè)計(jì)師自己創(chuàng)建的生成式字體變得更容易[5]。
圖3 《模擬算法:源相關(guān)網(wǎng)格系統(tǒng)》中的算法字體設(shè)計(jì)作品
圖4 《字母變體》中的算法字體設(shè)計(jì)作品
圖5 “生成字體”項(xiàng)目及創(chuàng)作流程的三個(gè)步驟
技術(shù)與創(chuàng)造力之間的鴻溝似乎正在縮小,設(shè)計(jì)師開始對(duì)編程持更加開放的態(tài)度。然而莫妮卡·洛薩達(dá)(Monica Losada)則從一個(gè)沒(méi)有編程知識(shí)背景的平面設(shè)計(jì)師的角度,嘗試性地探討了工具如何影響字體設(shè)計(jì)美學(xué)的問(wèn)題。她經(jīng)常使用Excel 辦公軟件和十字繡圖案生成器作為字體實(shí)驗(yàn)的起點(diǎn),通過(guò)這些作品,她開始質(zhì)疑作為設(shè)計(jì)師所使用的標(biāo)準(zhǔn)軟件,并探索以非傳統(tǒng)方式使用交互式工具或以不同方式使用標(biāo)準(zhǔn)化工具時(shí)所產(chǎn)生的各種可能性。在新作“開放作品(Open Works)”(見圖6)中探索了開源工具的設(shè)計(jì)可能性,并再次使用上述兩種非傳統(tǒng)設(shè)計(jì)軟件及開源工具Glyph Drawing Club,但她所面臨的挑戰(zhàn)是,既要?jiǎng)?chuàng)造一個(gè)具有凝聚力的視覺世界,又要突破每種工具的極限。她認(rèn)為,當(dāng)涉及復(fù)雜的系統(tǒng)時(shí),編碼會(huì)更加方便;相反地,在不考慮通過(guò)編碼實(shí)現(xiàn)自動(dòng)化的情況下,通過(guò)手動(dòng)操作的方式,設(shè)計(jì)者不得不更深入地思考正在使用的規(guī)則和參數(shù)[6]。設(shè)計(jì)師莉娜·韋伯(Lena Weber)也認(rèn)為在實(shí)踐中,只有那些編程知識(shí)達(dá)到一定門檻以上的使用者才能擁有高度的行動(dòng)自由,從而獲得隨心所欲的美感。雖然設(shè)計(jì)師能實(shí)現(xiàn)的結(jié)果受限于自己的知識(shí)水平和創(chuàng)造性編程的基本構(gòu)件,但其必須問(wèn)自己如何應(yīng)對(duì)這些限制。在系統(tǒng)性和生成性策略的指引下,她的字體設(shè)計(jì)作品(見圖7)一直在處理模糊的編程美學(xué)。在她看來(lái),當(dāng)作為交流手段的可解釋性和作為所使用腳本的簡(jiǎn)單數(shù)據(jù)可視化,這兩個(gè)方面達(dá)到平衡時(shí),就會(huì)產(chǎn)生“程序圖像的模糊性”[7]。
圖6 莫妮卡·洛薩達(dá)的算法字體設(shè)計(jì)實(shí)驗(yàn)“開放作品”
圖7 莉娜·韋伯的算法字體設(shè)計(jì)實(shí)驗(yàn)“模糊美學(xué)”
從在字母上添加重音符號(hào),到使用算法自動(dòng)調(diào)整行距和字距,再到插值或構(gòu)建自動(dòng)編譯復(fù)雜字體系列的腳本,這些任務(wù)都或多或少地由計(jì)算機(jī)程序自動(dòng)完成。自動(dòng)化不僅存在于日益復(fù)雜的工作流程中,它還一直延伸到軟件程序用來(lái)繪制幾何形態(tài)的數(shù)學(xué)運(yùn)算[6]。
在面對(duì)當(dāng)今普遍存在的技術(shù)焦慮上,字體設(shè)計(jì)師丹尼爾·文澤爾(Daniel Wenzel)決定直面問(wèn)題,并將這種自動(dòng)化完全融入他的工作流程中。他的“自動(dòng)化字體設(shè)計(jì)”(Automated Type Design)項(xiàng)目(見圖8),嘗試使用自動(dòng)化流程來(lái)創(chuàng)建字體。他使用了專業(yè)字體設(shè)計(jì)工具,以及自創(chuàng)或誤用的程序來(lái)模擬傳統(tǒng)字體設(shè)計(jì)工具無(wú)法實(shí)現(xiàn)的過(guò)程。他的工作流包含了5 種方法:部分字體作品完全是通過(guò)變化步驟來(lái)創(chuàng)建的,類似于內(nèi)維爾·布羅迪(Neville Brody)的FF Blur,通過(guò)變體創(chuàng)建字體;部分字體有意利用FontARk 或Prototype 等生成器的局限性,通過(guò)有限工具創(chuàng)建字體;使用數(shù)學(xué)公式來(lái)描述字體而不是手工繪制曲線,借助“藝術(shù)指導(dǎo)”策略創(chuàng)建字體;使用模擬筆刷等輔助工具生成新的權(quán)重、腳本和光學(xué)校正,借助輔助過(guò)程創(chuàng)建字體;利用生成的數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò),并在人工選擇的基礎(chǔ)上進(jìn)行自動(dòng)表格鏈接創(chuàng)建AI字體,借助自主程序創(chuàng)建字體。這看似一系列探索性實(shí)驗(yàn)的結(jié)果,卻是一個(gè)深具哲學(xué)意味項(xiàng)目的根基,該項(xiàng)目試圖在自動(dòng)化程度不斷提高的情況下,界定創(chuàng)作者自主權(quán)的邊界[8]。
圖8 “自動(dòng)化字體設(shè)計(jì)”項(xiàng)目
綜上所述,使用變量和代碼結(jié)構(gòu)來(lái)描述美學(xué)形式,探索了模擬與數(shù)字、系統(tǒng)與混沌、隨機(jī)與確定之間的字體設(shè)計(jì)的可能性。
在最新一份調(diào)查創(chuàng)意產(chǎn)業(yè)與人工智能關(guān)系日益密切的權(quán)威報(bào)道《智能的陰影:83%的創(chuàng)意人員已經(jīng)在使用機(jī)器學(xué)習(xí)工具,現(xiàn)在是與人工智能站在一起的時(shí)候了嗎?》中,就“人工智能在創(chuàng)意流程中的哪些方面被證明是最有用的?”這一問(wèn)題作出回應(yīng),38%的受訪者認(rèn)為人工智能最重要的作用在于創(chuàng)意的產(chǎn)生階段。經(jīng)過(guò)數(shù)據(jù)分析及調(diào)查表明,Impala 可以在一周內(nèi)讓客戶獲得從一張白紙到一個(gè)經(jīng)過(guò)全面測(cè)試的提案;ChatGPT、DALL·E2及MidJourney在最初的構(gòu)思階段,能快速鋪設(shè)大量假設(shè)場(chǎng)景,幫助客戶將其可視化[9]。因此,在字體設(shè)計(jì)實(shí)踐中,創(chuàng)造性地使用人工智能輔助其設(shè)計(jì)過(guò)程,人們將發(fā)現(xiàn)大量新的可能性和表達(dá)方式,遠(yuǎn)遠(yuǎn)超出人工智能作為模仿者或人工智能作為勞動(dòng)者的范疇。
人工智能是一種用于創(chuàng)造性發(fā)現(xiàn)的工具,它的萌芽期和缺陷性會(huì)給人類帶來(lái)驚喜和不可預(yù)知的沖動(dòng),從而創(chuàng)造出令人興奮的新事物。在字體設(shè)計(jì)自動(dòng)化流程中,大多數(shù)設(shè)計(jì)師使用生成對(duì)抗網(wǎng)絡(luò)(GAN:Generative Adversarial Network)來(lái)訓(xùn)練數(shù)據(jù)集,進(jìn)行風(fēng)格遷移、插值生成等工作。GAN是基于博弈論的一種無(wú)監(jiān)督學(xué)習(xí),通過(guò)對(duì)抗過(guò)程來(lái)評(píng)估生成模型的新框架。該框架由兩個(gè)深度學(xué)習(xí)模型構(gòu)成,一個(gè)捕捉真實(shí)數(shù)據(jù)分布,并生成新樣本的生成模型G(Generator),以及一個(gè)二分類器,判別輸入是真實(shí)數(shù)據(jù)還是生成樣本的判別模型D(Discriminator)。兩者相互博弈的過(guò)程減少了所需的人工干預(yù),可以將生成模型視為一種賦予人工智能的想象力,機(jī)器開始學(xué)習(xí)世界的面貌[10]。
NaN Studio思考的是能否訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)模型來(lái)生成逼真或只是有趣的字形。其在“機(jī)器學(xué)習(xí)字體(Machine Learning Font)”項(xiàng)目中(見圖9),使用RunwayML 對(duì)由2 674 種谷歌字體組成的數(shù)據(jù)集進(jìn)行了styleGAN 模型的訓(xùn)練,這些數(shù)據(jù)集在Drawbot 中以每個(gè)字形為一個(gè)單獨(dú)的圖像進(jìn)行組織。然后通過(guò)Python將Runway生成的圖像導(dǎo)入GlyphsApp,以處理最終字體。一般來(lái)說(shuō),每個(gè)字形的處理都需要3 000個(gè)模型訓(xùn)練步驟,110個(gè)獨(dú)特的字形總共需要550 h的訓(xùn)練時(shí)間。有些字符需要更長(zhǎng)、更多的步驟來(lái)創(chuàng)建可識(shí)別的形式。例如,盡管字符b被粗略地描述為字符d的簡(jiǎn)單鏡像,但它并不符合要求,需要三次單獨(dú)的訓(xùn)練嘗試和不斷增加的步驟數(shù)才能最終被識(shí)別為字母形式本身。有時(shí),一個(gè)字形在第一次嘗試時(shí)就會(huì)出現(xiàn)幾乎完美的效果。這種不一致性在一定程度上解釋了組成這個(gè)“字母表”的各種字形的復(fù)雜性。這個(gè)過(guò)程雖然有缺陷,但最終還是產(chǎn)生了一種奇特的字體,同時(shí)也暗示了機(jī)器學(xué)習(xí)字體的可能性和局限性[11]。丹尼爾·文澤爾認(rèn)為,GAN字體實(shí)驗(yàn)是人工智能在理性工藝方面具有優(yōu)勢(shì)的證明,也是保守字體設(shè)計(jì)冗余不斷增加的證據(jù)。他的作品“無(wú)題AI(Untitled AI)”(見圖10)通過(guò)改變2 000次的輸入數(shù)據(jù)來(lái)訓(xùn)練字體模型,最終得到了一個(gè)包含10 種字體的集合,其中有6 種襯線字體和4 種無(wú)襯線字體。然而,將像素結(jié)果矢量化并轉(zhuǎn)換成可用的字體格式,其缺陷提供了必要的特征和魅力[12]。
圖9 “機(jī)器學(xué)習(xí)字體”模型訓(xùn)練步驟對(duì)比及終版生成字體對(duì)比
圖10 “無(wú)題AI”項(xiàng)目
撇開機(jī)器學(xué)習(xí)可用于字體設(shè)計(jì)過(guò)程的大量自動(dòng)化流程不談,人工智能往往被貶低為對(duì)現(xiàn)有設(shè)計(jì)的插值,但無(wú)論是Process studio 生成的具有“人工”情感的emoji 表情的全新變體,還是安娜·費(fèi)伊(Anna Fay)與奧萊克桑德拉·普申伊奇娜(Oleksandra Pshenychna)基于拉丁文F 與西里爾文Φ的中間形式,或是尹林恩(Lynne Yun)以人臉為基礎(chǔ)進(jìn)行訓(xùn)練的無(wú)襯線字體項(xiàng)目,都是基于精選數(shù)據(jù)集進(jìn)行詩(shī)意的插值生成,發(fā)現(xiàn)了連續(xù)嵌入的可能性空間。
Process studio 為2019 年維也納雙年展“不可思議的價(jià)值(Uncanny Values)”(見圖11)開發(fā)了一種獨(dú)特的、由人工智能驅(qū)動(dòng)的傳播形式。展覽交流設(shè)計(jì)的核心是AImoji——由人工智能生成的表情符號(hào)。設(shè)計(jì)團(tuán)隊(duì)面對(duì)的是一種作為國(guó)際通用的視覺語(yǔ)言emoji,他們利用由幾千個(gè)常用表情符號(hào)組成的數(shù)據(jù)集作為輸入信息,借助DCGAN訓(xùn)練神經(jīng)網(wǎng)絡(luò),創(chuàng)造出這些微小數(shù)字表情的全新變體。其結(jié)果令人驚訝和不可思議:每一個(gè)AImoji 都會(huì)產(chǎn)生新的、迄今未知的“人工”情感,挑戰(zhàn)大眾對(duì)它們的解讀和互動(dòng)。延續(xù)同樣的方法,他們還創(chuàng)建了一種在不同字體重量和風(fēng)格之間變換的展覽字體標(biāo)識(shí)[13]。此外,安娜·費(fèi)伊與奧萊克桑德拉·普申伊奇娜的作品“EF”(見圖12),用拉丁文F 和西里爾文Φ搜索中間字母形式來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。字體設(shè)計(jì)師尹林恩則通過(guò)Runway ML 使用數(shù)以萬(wàn)計(jì)的無(wú)襯線樣本圖像訓(xùn)練了一個(gè)StyleGAN。她認(rèn)為,無(wú)襯線字體設(shè)計(jì)比襯線字體簡(jiǎn)單得多,因此是訓(xùn)練模型的優(yōu)選對(duì)象。任何機(jī)器學(xué)習(xí)項(xiàng)目都有一個(gè)共同的障礙,那就是機(jī)器需要大量的數(shù)據(jù)來(lái)訓(xùn)練,但幸運(yùn)的是MyFonts API提供了無(wú)襯線圖像的原始樣本。此外,尹林恩還對(duì)數(shù)據(jù)進(jìn)行處理和清理,這樣機(jī)器就能更好地識(shí)別字母形狀。RunwayML 的初始模型是以人臉為基礎(chǔ)進(jìn)行訓(xùn)練的,因此你會(huì)看到一系列不可思議的圖像,人臉變成了字母(見圖13)。最后,她還嘗試基于一個(gè)簡(jiǎn)短單詞“ASH”進(jìn)行數(shù)據(jù)集訓(xùn)練。結(jié)果表明,這是一個(gè)看起來(lái)非常清晰的單詞,但字符A是三個(gè)字母中最容易混淆的[14]。
圖11 “AImoji”和“不可思議的價(jià)值”人工智能字體的插值生成
圖12 人工智能字體設(shè)計(jì)作品“ef”的插值生成
對(duì)中文和其他一些書寫系統(tǒng)來(lái)說(shuō),人工智能可以成為一種解放工具,有可能催生出更多的獨(dú)立場(chǎng)景。如果未來(lái)的字體設(shè)計(jì)師可以使用和訓(xùn)練風(fēng)格遷移神經(jīng)網(wǎng)絡(luò),將他們的設(shè)計(jì)決策從幾百個(gè)種子字形應(yīng)用到上萬(wàn)種的字符中去。這種民主化將帶來(lái)更公平的使用權(quán)和更大的參與度,從而帶來(lái)更廣泛的字體表達(dá)。
zi2zi模型解決了中文字體之間風(fēng)格遷移的問(wèn)題,它是直接從流行的pix2pix 模型衍生和擴(kuò)展而來(lái)的。pix2Pix模型通過(guò)建立像素間的映射關(guān)系,來(lái)實(shí)現(xiàn)從輪廓?jiǎng)?chuàng)建到完全顯影,但當(dāng)同一個(gè)字符可能出現(xiàn)在多種字體中時(shí),它無(wú)法立即處理這種一對(duì)多的關(guān)系。所以zi2zi引入一對(duì)多建模的類別嵌入(Category Embedding for One-to-Many Modeling)技術(shù)來(lái)解決這個(gè)問(wèn)題,即在字符嵌入之前,將不可訓(xùn)練的高斯噪聲作為樣式嵌入解碼器。通過(guò)這種方法,編碼器仍可將同一字符映射到同一向量中,而解碼器則會(huì)同時(shí)使用字符嵌入和風(fēng)格嵌入來(lái)生成目標(biāo)字符。同時(shí),從AC-GAN模型中借鑒了多類類別損失Multi-class Category Loss,通過(guò)預(yù)測(cè)生成字符的風(fēng)格來(lái)監(jiān)督判別器對(duì)這種情況進(jìn)行懲罰,從而保留風(fēng)格本身,避免模型混淆并混合各種風(fēng)格。結(jié)果表明,許多字符推斷出的形狀幾乎與基準(zhǔn)真相完全相同。此外,zi2zi可以在不同風(fēng)格之間進(jìn)行插值,并見證兩者之間的狀態(tài),發(fā)現(xiàn)連續(xù)嵌入空間。該模型在漢字領(lǐng)域之外的泛化能力也得到了測(cè)試(見圖14),最左邊的一列是源中文字體的樣本,其余的是推斷的韓文對(duì)應(yīng)字體。值得注意的是,此時(shí)模型在訓(xùn)練過(guò)程中還沒(méi)有看到任何韓文字符。正如結(jié)果所示,輸出似乎與源中文字體的風(fēng)格非常相似,這有力地證明了該模型的泛化能力不僅僅局限于記住偏旁部首并將其重述;它還能推斷出未見過(guò)的部首的外觀,這表明它捕捉到了更深層次的結(jié)構(gòu)和風(fēng)格信息[15]。
圖14 zi2zi中文字體風(fēng)格遷移的深度學(xué)習(xí)模型(左)和中文到韓文的泛化過(guò)程(右)
CJK 字體為中日韓統(tǒng)一表意文字,有多種傳統(tǒng)表現(xiàn)方式,而作為現(xiàn)代的字體,則主要有宋體(歐美稱襯線體)、黑體(歐美稱非襯線體)、楷體、隸書體等多種類字體[16]。這些書寫系統(tǒng)涉及各個(gè)字形的復(fù)雜性和巨大的字符集。以中文體量為例,中文字體的最小標(biāo)準(zhǔn)字庫(kù)是GB2312,含6 763 個(gè)字;Unicode 編碼可以表示的所有中文約九萬(wàn)四千字;而現(xiàn)存最大的中文字庫(kù)甚至可達(dá)十幾萬(wàn)字[17]。CJK字體設(shè)計(jì)面臨三難困境(Trilemma),即無(wú)法同時(shí)滿足這三個(gè)方面的要求(字體的質(zhì)量要好,字體的字符集要大,降低人力成本)。這種三難困境的存在是人們需要技術(shù)來(lái)實(shí)現(xiàn)CJK字體設(shè)計(jì)自動(dòng)化的根本原因[18]。
面對(duì)CJK 字體的三難困境,由瑞士洛桑藝術(shù)與設(shè)計(jì)大學(xué)(ECAL)發(fā)起,與瑞士洛桑聯(lián)邦理工大學(xué)計(jì)算機(jī)視覺實(shí)驗(yàn)室(EPAL)合作的字體研究項(xiàng)目“愛字(AI字)”,開發(fā)了一種基于仿射變換(Affine Transformation)的人工智能算法,利用少于500 個(gè)基礎(chǔ)字符來(lái)自動(dòng)生成中文字體。該項(xiàng)目的第一步提供了超過(guò)九萬(wàn)字的漢字全字符集偏旁部首拆解數(shù)據(jù)庫(kù)(見圖15);第二步為了學(xué)習(xí)仿射變換(見圖16),VGG-19 網(wǎng)絡(luò)需要事先了解每個(gè)組件的原始位置和大小,將圖像輸入VGG-19網(wǎng)絡(luò)后,網(wǎng)絡(luò)會(huì)提取深層特征,深層特征可以表示大小、形狀等信息;第三步將所有這些信息組合在一起,再次將圖像饋入網(wǎng)絡(luò),在生成圖像與緊縮圖像之間進(jìn)行損失(loss)處理,有了這個(gè)損失,再進(jìn)行反向傳播,這樣網(wǎng)絡(luò)就能學(xué)會(huì)做出更好的決定。隨著歷時(shí)的增加,就可以獲得更好、更精確的不同組件的位置。區(qū)別于zi2zi等模型,它們大部分關(guān)注的是風(fēng)格分類及書法樣式,“愛字”項(xiàng)目則更期望生成筆畫更加平直、質(zhì)樸的正文樣式(body text)及系統(tǒng),任何設(shè)計(jì)師都可以用它來(lái)訓(xùn)練AI或作為字體設(shè)計(jì)的參考[17]。
圖15 “AI字”項(xiàng)目的偏旁部首和可分割組件的排版系統(tǒng)及數(shù)據(jù)庫(kù)
圖16 “AI字”項(xiàng)目學(xué)習(xí)仿射變換過(guò)程
Next Lab 設(shè)計(jì)的“Glow Sans”交互式工具(見圖17),使用一種新的字體表示和數(shù)百個(gè)特定操作生成新的樣式實(shí)例,它將輪廓報(bào)告為骨架點(diǎn)和相對(duì)于相應(yīng)骨架點(diǎn)的偏移,這種表示形式使人們能夠單獨(dú)操作結(jié)構(gòu)特征和筆畫特征,基于這個(gè)表示還定義了一些修改字形的操作。在這個(gè)互動(dòng)工具的基礎(chǔ)上,人們可以毫不費(fèi)力地調(diào)整字體中宮、轉(zhuǎn)換字體組件的大小,通過(guò)滑塊修改字體的基本矩陣。那為什么CJK字體設(shè)計(jì)自動(dòng)化仍然是個(gè)問(wèn)題,Next Lab認(rèn)為,技術(shù)問(wèn)題實(shí)際上有兩個(gè)正字法維度,“Glow sans”在風(fēng)格變化維度上取得了成功,但很難預(yù)測(cè)字符集的維度。Next lab 團(tuán)隊(duì)延續(xù)zi2zi 提出MS-EMD 模型(見圖18),它具有多種風(fēng)格編碼器,可以在風(fēng)格學(xué)習(xí)中表現(xiàn)更好,且在樣式和字符集維度上幫助CJK字體設(shè)計(jì)。使用這種技術(shù)出現(xiàn)了未編碼的字符,人工智能生成了并不存在的漢字,并附加到了位圖中,探索了潛在空間的想象力[18]。
圖17 “Glow Sans”字體交互設(shè)計(jì)工具界面
圖18 MS-EMD模型在風(fēng)格變化和字符集維度上優(yōu)化的CJK字體設(shè)計(jì)
此外,吉恩·科根(Gene Kogan)用代碼在手寫漢字?jǐn)?shù)據(jù)庫(kù)上訓(xùn)練DCGAN,不僅可以探索單個(gè)字符周圍的鄰域,還可以跨越字符之間的潛在空間(見圖19)。DCGAN 在約100 萬(wàn)個(gè)手寫簡(jiǎn)體中文字符的標(biāo)注子集上進(jìn)行訓(xùn)練,然后生成器就能生成原始數(shù)據(jù)集中沒(méi)有的偽造字符圖像。生成器由高維潛在空間中的一個(gè)向量參數(shù)化,讓人們可以窺探它的想象力。沿著從一個(gè)字符到下一個(gè)字符的直線進(jìn)行采樣,可以獲得一種假想字符的印象,這些假想字符來(lái)自真實(shí)字符之間的插值,或許與語(yǔ)義上的中間概念相對(duì)應(yīng)[19]。
圖19 20個(gè)出現(xiàn)頻率最高的字符中每對(duì)字符之間的插值循環(huán)矩陣
綜上所述,人工智能能解放像漢字這樣的字體,實(shí)現(xiàn)勞動(dòng)自動(dòng)化;同時(shí),當(dāng)字體插值越來(lái)越接近時(shí),是否可以在字體設(shè)計(jì)中創(chuàng)造性地使用人工智能探索新的形式領(lǐng)域,人們應(yīng)該充滿好奇心地接受這些新技術(shù),不僅將其作為節(jié)省勞動(dòng)力的措施,還將其作為進(jìn)行創(chuàng)造性實(shí)驗(yàn)的工具[20]。
通過(guò)基于數(shù)學(xué)定理、計(jì)算幾何的算法字體設(shè)計(jì)案例分析,回應(yīng)了如何利用數(shù)據(jù)和參數(shù)來(lái)編碼形狀語(yǔ)法與視覺系統(tǒng);通過(guò)基于生成式對(duì)抗網(wǎng)絡(luò)GAN的人工智能字體設(shè)計(jì)案例分析驅(qū)動(dòng)字體插值生成與風(fēng)格遷移的方法。在藝科融合的新文科建設(shè)背景及人機(jī)耦合的設(shè)計(jì)趨勢(shì)下,將設(shè)計(jì)挑戰(zhàn)作為進(jìn)化和創(chuàng)新的契機(jī),允許人工智能探索人類創(chuàng)造力的協(xié)作維度,這種方法是否能作為一種創(chuàng)新策略嵌入到字體設(shè)計(jì)流程中,保持系統(tǒng)的開放性,賦予技術(shù)系統(tǒng)與人類主體之間不斷發(fā)展的對(duì)話,這有待進(jìn)一步研究。