姚秦川
2004年年初,美國《紐約時(shí)報(bào)》傳出消息:為了便于報(bào)紙以后的管理,以及方便讀者查閱,《紐約時(shí)報(bào)》打算將那些已經(jīng)出版并保存了幾十年的舊報(bào)紙全部電子化。不過,這項(xiàng)工作到底該如何操作,卻讓工作人員頗感頭疼。
當(dāng)時(shí),最簡(jiǎn)單可行的辦法就是掃描那些舊報(bào)紙,進(jìn)行光學(xué)字符識(shí)別。不過,因?yàn)槟切┡f報(bào)紙有油墨的痕跡和折疊的印記,并且顏色發(fā)黃變暗,再加上幾十年前的字體與現(xiàn)在的字體有很大的區(qū)別,所以辨識(shí)起來極為費(fèi)勁。除此之外,更令人擔(dān)心的是,由于那些報(bào)紙保存的時(shí)間久遠(yuǎn),紙張變得非常脆弱,稍有不甚,就會(huì)損壞整張報(bào)紙。當(dāng)時(shí),《紐約時(shí)報(bào)》的工作人員就關(guān)于要不要用掃描的辦法來完成這項(xiàng)工作進(jìn)行了多次會(huì)議,會(huì)議上大家各執(zhí)一詞,沒有一個(gè)統(tǒng)一的結(jié)果。最終,報(bào)社高層領(lǐng)導(dǎo)決定,基于保護(hù)報(bào)紙的考慮,他們不打算采用掃描的辦法,同時(shí)為了盡快找到簡(jiǎn)單可行的辦法,報(bào)社在報(bào)紙上刊登啟事,希望廣大市民能獻(xiàn)計(jì)獻(xiàn)策,解決這個(gè)棘手的問題。
啟事發(fā)出去后,很快便有市民來到報(bào)社,說他想到了一個(gè)主意,不過是一種笨辦法,那就是報(bào)社派出專門的打字員,逐字逐句地重新敲打報(bào)紙上的內(nèi)容。然后,報(bào)社安排專職人員進(jìn)行校對(duì)。這個(gè)辦法雖然行得通,但實(shí)際操作起來并不容易,不僅進(jìn)展速度非常緩慢,而且效果也不理想。最終,這個(gè)辦法被報(bào)社否定了,但他們還是對(duì)這位市民給予了獎(jiǎng)勵(lì)——免費(fèi)贈(zèng)閱半年的《紐約時(shí)報(bào)》。時(shí)間一天天過去,就在報(bào)社領(lǐng)導(dǎo)都對(duì)解決這個(gè)問題失去信心時(shí),卡內(nèi)基梅隆大學(xué)的博士生路易斯·馮·安得知了此事,他打電話給報(bào)社,主動(dòng)將此難題包攬了過來。
路易斯之所以敢接手這件棘手的事情,是因?yàn)樵趦赡昵?,他發(fā)明了一件新鮮的事物——驗(yàn)證碼,這是區(qū)分當(dāng)下程序使用者是計(jì)算機(jī)還是人的公共全自動(dòng)程序。同時(shí),該程序還具有可防止惡意破解密碼、刷票等功能,最值得贊賞的是,它操作簡(jiǎn)單,一個(gè)人就可以完成復(fù)雜的工作。在路易斯將自己發(fā)明的驗(yàn)證碼推向市場(chǎng)后,立即在全世界廣受歡迎,同時(shí)它也被應(yīng)用到了各行各業(yè)。
《紐約時(shí)報(bào)》的領(lǐng)導(dǎo)商量后,決定將此任務(wù)交給路易斯完成。路易斯在接手了這個(gè)艱巨的任務(wù)后想到,全世界每天都有幾億個(gè)驗(yàn)證碼在被校驗(yàn),如果把《紐約時(shí)報(bào)》的文章切成小片,再把它們當(dāng)作驗(yàn)證碼發(fā)給全世界的人,這些人在使用驗(yàn)證碼的時(shí)候,不知不覺中就幫助報(bào)紙完成了輸入和校對(duì)。
不僅如此,對(duì)于那些難以識(shí)別的字符,系統(tǒng)可以發(fā)給多個(gè)校驗(yàn)者,當(dāng)幾個(gè)人傳回的數(shù)據(jù)一致時(shí),就說明識(shí)別的結(jié)果是正確的。然后,再將它們返回系統(tǒng)重新整合,一切便萬事大吉。最終,路易斯利用這個(gè)簡(jiǎn)單又便利的辦法,將《紐約時(shí)報(bào)》幾十年的報(bào)紙全部實(shí)現(xiàn)了電子化,解決了困擾《紐約時(shí)報(bào)》多時(shí)的難題。他也因?yàn)榇耸?,被?dāng)年的《紐約時(shí)報(bào)》授予“年度創(chuàng)新人物獎(jiǎng)”。