国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機器學習如何讓破譯早已消亡的古老文字

2019-08-24 13:05:11一只小手
科學大眾(中學) 2019年8期
關鍵詞:泥板石印古老

一只小手

在大英博物館的柔光中,人們只能勉強看到鐫刻在這些古老泥板上的密密麻麻的楔形標記。這些細小的標記,是世界上最古老的書寫系統(tǒng)——楔形文字的遺跡。

大約150年前,學者們首次破譯了楔形文字,然而直到目前,能被讀懂的文字僅有一小部分,仍有約90%的文字未被破譯出來。但是,這種情況可能會有所改變,一項新技術正在給它們進行“解鎖”,效果還挺不錯。這都要歸功于現(xiàn)代工具——機器翻譯。

現(xiàn)在你是不是越來越好奇了,連學者們都無法完全破解這種古老文字的秘密,機器又是如何做到的呢?

見證古帝國的興衰

楔形文字起源于5000多年前的美索不達米亞,位于底格里斯河和幼發(fā)拉底河之間,也就是現(xiàn)在的伊拉克。它記錄了一個長達3000年之久的、復雜而迷人的文明。從王室之間憤怒內斗的信件,到安撫一個任性嬰兒的儀式,這些泥板可以讓人們從一個獨特的視角了解那段歷史,它們記錄了阿卡德、亞述和巴比倫帝國的興衰。據(jù)估計,人們已經(jīng)挖掘出了約50萬塊楔形文字板,但還有很多仍深埋地下。

約150年前,學者們首次破譯了楔形文字,然而直到目前,仍有約90%的楔形文字未被翻譯出來。

但是,這種情況可能會有所改變.這都要歸功于現(xiàn)代工具——機器翻譯。

加拿大多倫多大學亞述學研究員佩龍現(xiàn)在正在進行的一個項目,是用機器翻譯公元前21世紀以來美索不達米亞文明的行政記錄,數(shù)量多達69000份。

美索不達米亞文明孕育了車輪、天文學、每小時有60分鐘的計時制、地圖、洪水和方舟的故事,以及世界上最古老的英雄敘事詩——《吉爾伽美什史詩>。這本詩集主要是用蘇美爾語和阿卡德語寫成的,能讀懂這些語言的學者少之又少。

除了泥板,還有5萬多枚美索不達米亞雕刻印章散落在世界各地。幾千年來,古人使用由雕刻石頭制成的印章,這些印章被壓入潮濕的黏土中,用來標記門、罐子、石板和其他物品。這些刻章只有1/10被編入目錄,更不用說翻譯了。

英國牛津大學亞述學教授達爾表示,“我們所獲得的關于美索不達米亞文明的資料比古希臘、古羅馬和古埃及的加起來還要多,但真正的挑戰(zhàn)在于找到能讀懂它們的人?!?/p>

佩龍與其團隊正在對一個數(shù)據(jù)庫中的4000個古代行政文本樣本編寫算法。這些行政文本包括交易和運輸記錄,比如把羊、蘆葦束或啤酒運到神廟或個人手中的記錄。這些文字最初是用蘆葦筆刻在黏±上的,向我們展示了古代美索不達米亞文明的日常生活情況,包括權力結構和貿易網(wǎng)絡,同時還展示了社會歷史的其他方面,如女工的角色。

這些行政文書的措辭很簡單,例如“第15天,廚房有11只母山羊”。這種特點使得它們特別適合被自動化處理。一旦算法學會了如何將樣本文本翻譯成英語,它們就能自動翻譯其他泥板上的文字了。

佩龍希望機器分析也能弄清蘇美爾語的一些特征,這是至今仍困擾著現(xiàn)代學術界的難題。這種已經(jīng)滅絕的語言與任何現(xiàn)代語言都沒有聯(lián)系,但卻保存在以楔形文字書寫的泥板中。這可能是我們與更古老,甚至沒有歷史記載的社會之間最后的聯(lián)系。

觸碰古老寶藏

多虧了先進的成像技術,現(xiàn)在任何人只要能上網(wǎng)就能接觸到這些寶藏。比如,世界上現(xiàn)存最古老的皇家圖書館,人們正在將它數(shù)字化。這座圖書館位于尼尼微,由亞述國王亞述巴尼帕建造。雖然早在公元前612年,尼尼微遭遇洗劫時,這些泥板被火烤得又黑又硬,但上面的文字仍可辨認。

新的成像技術讓人們在處理這些古老且破損嚴重的文本時更加輕松。有了精細的圖像,人們就有可能找出那些肉眼看不見的模糊標記。

一個名為“楔形文字數(shù)字圖書館倡議”的項目,將保存在德黑蘭、巴黎和牛津館藏中的泥板及印章進行數(shù)字化處理。這個龐大的在線數(shù)據(jù)庫已經(jīng)包含了世界上約1/3的楔形文字,以及一些未被破譯的書面語言(如古伊朗的原始埃蘭語)。

如果沒有這樣龐大的數(shù)字資源,讓機器進行翻譯幾乎是不可能的。

數(shù)字化還幫助研究者們將散落在世界各地的文本拼湊起來。

研究人員曾對美索不達米亞的200多枚石印的3D圖像進行了數(shù)字化處理。在試點項目中,他們使用了人工智能算法校驗了6塊碑文,并識別出在世界其他地方發(fā)現(xiàn)的與之匹配的石印。算法準確地挑選出了兩塊現(xiàn)存于意大利和美國的泥板,這兩塊泥板上蓋的石印是一樣的。

在過去,想要將石印和印痕匹配起來困難重重,因為許多石印保存在數(shù)千千米之外的地方。而現(xiàn)在,人工智能的發(fā)展能幫助人們探索世界各地收藏品中蘊藏的豐富信息。

破譯古人的語言

成像技術也改變了對于未破譯文本的研究。

對于數(shù)量少、具創(chuàng)造性文本的破譯,人類往往比機器做得更好,人類有著對生活和組織方式的深入理解,以及高度的靈活性。例如,早期的楔形文字符號并不是線性排布的,而是簡單地與畫在周圍的方框排在一起。原始埃蘭語是三維立體的,一個圓印的深淺不同意義也不同。但是,技術可以放大、分享和比較圖片的細節(jié),加快了破譯進程。

佩龍希望機器最終能夠翻譯更復雜的蘇美爾語和其他語言,比如阿卡德語。也許有一天,我們將能夠閱讀所有古老文字的翻譯版本。

古代美索不達米亞的國王們深深地思考著過去和未來。他們崇敬前朝的楔形文字,也將記錄著他們名字和成就的銘文埋藏地下,希望后世的統(tǒng)治者會將榮耀歸于自己。

在某種程度上,他們的愿望已經(jīng)實現(xiàn)了。他們經(jīng)歷過的戰(zhàn)爭和征服可能已經(jīng)被大多數(shù)人遺忘,但是他們最強大的發(fā)明——文字,在過去的幾干年里助力了人類思想和技術的發(fā)展。

而現(xiàn)在,人類開始訓練機器從過去中學習。(原文刊載于BBC網(wǎng)站,標題為《The key to cracking long-deadlanguages?》)(責任編輯:白玉磊責任校對:司明婧)

猜你喜歡
泥板石印古老
近代雕版翻刻新式印刷書籍之出版機構考述
淺談石印術與中國近代印刷業(yè)的變革
出版廣角(2023年15期)2023-10-20 05:11:31
阿馬爾那泥板的涅槃重生之旅
大眾考古(2021年7期)2021-01-16 01:06:50
拍塊泥板做浮雕
少兒美術(2020年3期)2020-12-06 07:32:48
泥板的疊加、拼合、包裹與刻線
少兒美術(2020年1期)2020-12-06 06:56:22
淺談泥板成型工藝在陶藝創(chuàng)作實踐中的思考
陶瓷研究(2019年4期)2019-06-24 05:55:58
我與《齊白石三百石印》的情緣
最古老的九大樹木
古老的聲,真摯的愛
學生天地(2016年34期)2016-05-17 05:47:44
古老的瑞典
台前县| 得荣县| 沙雅县| 金昌市| 温州市| 丰城市| 清水河县| 巨鹿县| 疏勒县| 土默特左旗| 饶河县| 阜宁县| 江口县| 陆川县| 抚宁县| 曲阳县| 含山县| 老河口市| 蓬安县| 绥德县| 富平县| 麦盖提县| 江城| 乌鲁木齐县| 昌平区| 深水埗区| 榆林市| 扶沟县| 白水县| 文登市| 前郭尔| 兴山县| 赤峰市| 东源县| 福州市| 五峰| 沽源县| 平顺县| 东明县| 桂东县| 淮滨县|