国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從指尖上的舞蹈到腦電波的飛揚(yáng)

2015-08-18 05:31:47劉宗凡
中國(guó)信息技術(shù)教育 2015年13期
關(guān)鍵詞:輸入法鍵盤(pán)語(yǔ)音

劉宗凡

編者按:如果時(shí)光倒流到二十年前,五筆字型和WPS就代表了計(jì)算機(jī)。在當(dāng)時(shí)網(wǎng)絡(luò)還不普及的時(shí)代,能在計(jì)算機(jī)上打出一串串文字,就代表了你是一個(gè)計(jì)算機(jī)高手。現(xiàn)在我們整天在鍵盤(pán)上敲敲打打,把心里的想法變成文字??墒俏覀兛赡軟](méi)有想過(guò),為什么敲擊鍵盤(pán)可以輸入文字呢?除了鍵盤(pán),有沒(méi)有其他辦法輸入文字呢?甚至意識(shí)是不是能控制計(jì)算機(jī)呢?在此,主持人和嘉賓將分兩期對(duì)這一問(wèn)題進(jìn)行深入探討。

● 遙遠(yuǎn)的穿孔紙帶

也許我們覺(jué)得計(jì)算機(jī)配置一個(gè)鍵盤(pán),是天經(jīng)地義的事。但實(shí)際上,計(jì)算機(jī)在上世紀(jì)80年代中期,還普遍是用穿孔紙帶或穿孔卡片來(lái)向計(jì)算機(jī)輸入信息的。如果我們追溯到更古老的計(jì)算機(jī),如第一臺(tái)計(jì)算機(jī)ENIAC,要讓它進(jìn)行一項(xiàng)計(jì)算,只能重新連接線路!圖1為穿孔紙帶。

為什么要用這么奇怪的紙帶來(lái)輸入信息?我們首先要了解計(jì)算機(jī)的工作原理。我們使用的計(jì)算機(jī)千姿百態(tài),除了常用的微機(jī),還有小型機(jī)、大型機(jī)、巨型機(jī)、嵌入式計(jì)算機(jī)以及各種智能設(shè)備,如手機(jī)、平板等,但無(wú)一例外都是使用存儲(chǔ)程序思想進(jìn)行工作,我們稱之為馮·諾依曼體系計(jì)算機(jī)。馮·諾依曼體系計(jì)算機(jī)的一個(gè)重要特點(diǎn)是使用二進(jìn)制進(jìn)行設(shè)計(jì)。呈現(xiàn)在我們面前豐富多彩的多媒體信息,如動(dòng)聽(tīng)的音樂(lè)、優(yōu)美的動(dòng)畫(huà)、漂亮的圖片、絢麗的視頻……在計(jì)算機(jī)內(nèi)部都是冷冰冰的“0”和“1”。一個(gè)“0”或“1”我們稱之為一位(bit,比特),8位組合在一起稱為一個(gè)字節(jié)(Byte)。字節(jié)是計(jì)算機(jī)存儲(chǔ)的基本單位。

既然計(jì)算機(jī)內(nèi)部是用二進(jìn)制表示,那么要計(jì)算機(jī)理解我們的思維,自然使用二進(jìn)制是最直接的方式。打孔紙帶一行有8個(gè)位置可以打孔,如果某個(gè)位置打孔,代表這是一個(gè)“1”,否則代表這是一個(gè)“0”。一行8個(gè)位置,剛好組成一個(gè)字節(jié)。計(jì)算機(jī)通過(guò)紙帶閱讀機(jī)(紙帶輸入機(jī))來(lái)識(shí)別信息,從而輸入計(jì)算機(jī)。

當(dāng)然,要在紙帶上打孔,是一件非常麻煩的事情。打孔時(shí)用一個(gè)特制的鋼夾子把紙帶夾住,夾子上有八個(gè)孔。根據(jù)預(yù)先約定的位置,用一個(gè)鋼頂針在給定的孔位把計(jì)算機(jī)一條指令在紙帶上鉆成幾個(gè)孔。一個(gè)程序少說(shuō)也有幾百上千條指令,穿在紙帶上后紙帶足有好幾米長(zhǎng),沒(méi)有個(gè)三五天是穿不完的。所以這個(gè)時(shí)期,計(jì)算機(jī)只是少數(shù)科研機(jī)構(gòu)及少數(shù)計(jì)算機(jī)專(zhuān)家才能使用,和普通老百姓幾乎沒(méi)有什么聯(lián)系。

● 熟悉的鍵盤(pán)

鍵盤(pán)的發(fā)明,是要遠(yuǎn)遠(yuǎn)早于現(xiàn)代計(jì)算機(jī)的。1714年,英、美、法、意等國(guó)家發(fā)明了各種形式的打字機(jī),最早的鍵盤(pán)就是那個(gè)時(shí)候開(kāi)始應(yīng)用在打字機(jī)上。1868年,克里斯多?!な挔査乖O(shè)計(jì)了現(xiàn)在使用的鍵盤(pán),即使用QWERTY鍵盤(pán)布局,一直使用至今。

上世紀(jì)80年代初,IBM在XT/AT計(jì)算機(jī)推出M型鍵盤(pán),是現(xiàn)代鍵盤(pán)史上的巔峰之作。隨后計(jì)算機(jī)上使用鍵盤(pán)輸入信息越來(lái)越普及,穿孔紙帶走入博物館。

鍵盤(pán)由一組開(kāi)關(guān)矩陣組成,包括數(shù)字鍵、字母鍵、符號(hào)鍵、功能鍵及控制鍵等。每一個(gè)按鍵在計(jì)算機(jī)中都有它的唯一代碼。最初的鍵盤(pán)為84鍵,后來(lái)出現(xiàn)了101鍵的鍵盤(pán)。在Windows 95出現(xiàn)以后,104鍵的鍵盤(pán)又出現(xiàn)了,它和101鍵的鍵盤(pán)相比,多了幾個(gè)快捷鍵,用來(lái)快速調(diào)用Windows 95里的菜單。微軟的Windows 98流行后,市場(chǎng)上又出現(xiàn)了一種108鍵的“Windows 98”鍵盤(pán),區(qū)別是多了Windows 98的功能鍵:Power、Sleep和Wake Up。之后的鍵盤(pán)鍵數(shù)就越來(lái)越多了,主要提供一些多媒體的功能,如CD播放、互聯(lián)網(wǎng)應(yīng)用等。

當(dāng)按下某個(gè)鍵時(shí),鍵盤(pán)接口將該鍵的二進(jìn)制代碼送入計(jì)算機(jī)主機(jī)中,并將按鍵字符顯示在顯示器上。當(dāng)快速大量輸入字符,主機(jī)來(lái)不及處理時(shí),先將這些字符的代碼送往內(nèi)存的鍵盤(pán)緩沖區(qū),然后再?gòu)脑摼彌_區(qū)中取出進(jìn)行分析處理。鍵盤(pán)接口電路多采用單片微處理器,由它控制整個(gè)鍵盤(pán)的工作,如接上電時(shí)對(duì)鍵盤(pán)的自檢、鍵盤(pán)掃描、按鍵代碼的產(chǎn)生、發(fā)送及與主機(jī)的通訊等。

● 漢字的輸入與顯示

英文輸入和打字機(jī)基本一致,每個(gè)鍵對(duì)應(yīng)唯一的二進(jìn)制碼,基本上不用經(jīng)過(guò)什么處理,非常簡(jiǎn)單。但漢字常用的就有好幾千個(gè),《中華字?!肥珍浀臐h字更是超過(guò)八萬(wàn)個(gè)。這么龐大的字庫(kù),用一一對(duì)應(yīng)的鍵盤(pán)是無(wú)法想象的。漢字從輸入到輸出這一過(guò)程,要經(jīng)過(guò)一系列復(fù)雜的編碼—漢字的輸入:輸入碼→交換碼(國(guó)標(biāo)碼);漢字的機(jī)內(nèi)表示:機(jī)內(nèi)碼;漢字的輸出:字形碼。圖2為漢字編碼的關(guān)系。

1.輸入碼

區(qū)位碼:區(qū)位碼是一個(gè)四位的十進(jìn)制數(shù),每個(gè)國(guó)標(biāo)碼或區(qū)位碼都對(duì)應(yīng)著一個(gè)唯一的漢字或符號(hào),但因?yàn)槭M(jìn)制數(shù)我們很少用到,所以大家常用的是區(qū)位碼,它的前兩位叫做區(qū)碼,后兩位叫做位碼。在區(qū)位碼中,01-09區(qū)為特殊字符,10-55區(qū)為一級(jí)漢字(3755個(gè)最常用的漢字,按拼音字母的次序排列),56-87區(qū)為二級(jí)漢字(3008個(gè)漢字,按部首次序排列),在區(qū)位碼漢字輸入方法中,漢字編碼無(wú)重碼,在熟練掌握漢字的區(qū)位碼后,錄入漢字的速度是很快的,但若想記憶住全部區(qū)位碼是相當(dāng)困難的,常使用于錄入特殊符號(hào),如制表符、希臘字母等。

音碼:音碼是按照拼音規(guī)定來(lái)輸入漢字,不需要特殊記憶,符合人的思維習(xí)慣,只要會(huì)拼音就可以輸入漢字,非常簡(jiǎn)單直接,是現(xiàn)在種類(lèi)最多的輸入碼。但拼音輸入的缺點(diǎn)也非常明顯:一是漢字同音字太多,所以重碼率特別高,有時(shí)要輸入一個(gè)不太常用的漢字往往要翻很多頁(yè),輸入效率比較低;二是對(duì)于普通話不太標(biāo)準(zhǔn)、拼音不太精確的人來(lái)說(shuō),輸入是有一定困難的,往往要反復(fù)嘗試;三是有些不認(rèn)識(shí)的字無(wú)法輸入。雖然缺點(diǎn)很多,但音碼學(xué)習(xí)成本近于零,所以對(duì)輸入速度要求不高的普通用戶來(lái)說(shuō),音碼成為了首選輸入法。

入門(mén)級(jí)用戶常用全拼輸入法,以單字輸入為主。智能ABC以詞組輸入提高輸入速度,微軟拼音以句為目標(biāo)輸入,能在輸入過(guò)程中自動(dòng)調(diào)整輸入過(guò)的字詞,從而減少選擇漢字的操作,以提高效率。搜狗拼音輸入法是基于搜索引擎技術(shù)的、特別適合網(wǎng)民使用的、新一代的輸入法產(chǎn)品,用戶可以通過(guò)互聯(lián)網(wǎng)備份自己的個(gè)性化詞庫(kù)和配置信息。與整句輸入風(fēng)格的微軟拼音不同的是它偏向于詞語(yǔ)輸入特性,為中國(guó)國(guó)內(nèi)現(xiàn)今主流漢字拼音輸入法之一。

形碼:形碼是按漢字的字形(筆畫(huà)、部首)來(lái)進(jìn)行編碼的。漢字是由許多相對(duì)獨(dú)立的基本部分組成的,在漢字編碼中稱為字根或字元。形碼是一種將字根或筆畫(huà)規(guī)定為基本的輸入編碼,再由這些編碼組合成漢字的輸入方法,其中赫赫有名的就是五筆字型輸入法。

五筆字型輸入法是王永民在1983年8月發(fā)明的一種漢字輸入法。因?yàn)榘l(fā)明人姓王,所以也稱為“王碼五筆”。五筆字型完全依據(jù)筆畫(huà)和字形特征對(duì)漢字進(jìn)行編碼,是典型的形碼輸入法。五筆是目前中國(guó)以及一些東南亞國(guó)家如新加坡、馬來(lái)西亞等國(guó)的最常用的漢字輸入法之一。

和音碼相比,形碼的重碼率相當(dāng)?shù)停梢詫?shí)現(xiàn)盲打;根據(jù)漢字的使用頻率,每個(gè)漢字只要通過(guò)兩三次,最多四次擊鍵就可以打出來(lái);常用詞組都只需要四次擊鍵就可以打出來(lái),減少了擊鍵次數(shù),大大提高了輸入效率;只要掌握了編碼規(guī)則,即使碰到了不認(rèn)識(shí)的字也可以輕松打出來(lái)。當(dāng)然,形碼的缺點(diǎn)也非常明顯,就是要投入比較大的成本來(lái)進(jìn)行學(xué)習(xí)才能熟練使用。所以現(xiàn)在除了對(duì)打字速度要求比較高的場(chǎng)合,很少會(huì)有人去專(zhuān)門(mén)學(xué)習(xí)五筆字型了,五筆字型在輸入法市場(chǎng)逐漸成了小眾的選擇。

音形碼:音形碼吸取了音碼和形碼的優(yōu)點(diǎn),將二者混合使用。常見(jiàn)的音形碼有自然碼、鄭碼等。其中自然碼是目前比較常用的一種混合碼。這種輸入法以音碼為主,以形碼作為可選輔助編碼,而且其形碼采用“切音”法,解決了不認(rèn)識(shí)的漢字輸入問(wèn)題。這類(lèi)輸入法的特點(diǎn)是速度較快,又不需要專(zhuān)門(mén)培訓(xùn)。音形碼既有音碼和形碼的優(yōu)點(diǎn),又同時(shí)有它們的缺點(diǎn),從理論上來(lái)說(shuō)是一種不錯(cuò)的選擇,但實(shí)際上因?yàn)樗v速度比不過(guò)五筆字型,講簡(jiǎn)單拼不過(guò)音碼,基本上沒(méi)有什么人使用了。

2.交換碼

交換碼是指不同的具有漢字處理功能的計(jì)算機(jī)系統(tǒng)之間或記錄媒體之間在交換漢字信息時(shí)所使用的代碼標(biāo)準(zhǔn)。

GB2313碼:全國(guó)信息技術(shù)化技術(shù)委員會(huì)于1981年5月發(fā)布的《信息交換用漢字編碼字符集·基本集》(代號(hào)GB2312-80),共收錄了6763個(gè)漢字和682個(gè)圖形符號(hào)。6763個(gè)漢字按其使用頻率和用途,又可分為一級(jí)常用漢字3755個(gè),二級(jí)次常用漢字3008個(gè)。其中一級(jí)漢字按拼音字母順序排列,二級(jí)漢字按偏旁部首排列。采用兩個(gè)字節(jié)對(duì)每個(gè)漢字進(jìn)行編碼,每個(gè)字節(jié)各取七位,這樣可對(duì)128×128=16384個(gè)字符進(jìn)行編碼。這是現(xiàn)在最常用的漢字編碼,稱為國(guó)標(biāo)碼。

Big5碼:即“大五碼”,是繁體字常用的編碼,共收入13060個(gè)繁體字,普遍使用于臺(tái)灣、香港等地。

GBK碼:兩字節(jié)編碼的國(guó)標(biāo)碼只收錄了6763個(gè)漢字,在日常生活中經(jīng)常捉襟見(jiàn)肘。1995年12月1日,我國(guó)發(fā)布了《漢字內(nèi)碼擴(kuò)展規(guī)范》,即GBK碼,以四字節(jié)進(jìn)行編碼,收入了21886個(gè)漢字和符號(hào),大大方便了我們的使用。

Unicode碼:這是由國(guó)際組織設(shè)計(jì),可以容納全世界所有語(yǔ)言文字的編碼方案,解決了傳統(tǒng)的字符編碼方案的局限,以滿足跨語(yǔ)言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求。

3.機(jī)內(nèi)碼

漢字機(jī)內(nèi)碼是漢字在信息處理系統(tǒng)內(nèi)部最基本的表示形式,它是計(jì)算機(jī)內(nèi)部對(duì)漢字進(jìn)行存儲(chǔ)、運(yùn)算、傳輸時(shí)所使用的代碼,通常是對(duì)漢字交換碼做出某種標(biāo)識(shí)之后得到的內(nèi)部碼,與交換碼之間有對(duì)應(yīng)關(guān)系。

4.字形碼

每一個(gè)漢字都是一種象形文字,可以看成一個(gè)特定的圖形。這些圖形可以用點(diǎn)陣、向量等方式表示,其中最基本的是用點(diǎn)陣加以表示,稱為字形碼。一般的點(diǎn)陣規(guī)模有16×16,24×24,32×32,64×64等,每一個(gè)點(diǎn)在存儲(chǔ)器中用一個(gè)二進(jìn)制位(bit)存儲(chǔ)。在相同點(diǎn)陣中,不管其筆畫(huà)繁簡(jiǎn),每個(gè)漢字所占的字節(jié)數(shù)相等。

為了節(jié)省存儲(chǔ)空間,普遍采用了字形數(shù)據(jù)壓縮技術(shù)。所謂的矢量漢字是指用矢量方法將漢字點(diǎn)陣字模進(jìn)行壓縮后得到的漢字字形的數(shù)字化信息。圖3為“你”字的中文字模、位代碼及字模信息。

● 成長(zhǎng)的語(yǔ)音輸入

沒(méi)有經(jīng)過(guò)專(zhuān)門(mén)訓(xùn)練的人,用鍵盤(pán)輸入漢字,每分鐘可能就20~30個(gè)。而我們一般講話時(shí)語(yǔ)速能達(dá)到每分鐘160個(gè)漢字左右。如果能直接把語(yǔ)音變成文字,這是多么大的誘惑!

當(dāng)然,中國(guó)地域廣大,各地漢語(yǔ)發(fā)音千差萬(wàn)別,識(shí)別難度很高,這一直是人工智能領(lǐng)域未完全攻克的難點(diǎn)。IBM、微軟、蘋(píng)果、谷歌等國(guó)際大公司都曾投入非常多的精力來(lái)提高語(yǔ)音識(shí)別率,國(guó)內(nèi)科大訊飛、搜狐、觸寶、百度等公司也投入巨資來(lái)進(jìn)行研究?,F(xiàn)在雖然說(shuō)語(yǔ)音識(shí)別不能達(dá)到百分之百的準(zhǔn)確率,但已經(jīng)邁入了實(shí)用的階段。特別是在移動(dòng)端,蘋(píng)果個(gè)人語(yǔ)音數(shù)字助理Siri可稱得上移動(dòng)應(yīng)用的里程碑,引領(lǐng)了語(yǔ)音輸入的潮流。

我們來(lái)體驗(yàn)一下微軟在Windows7里提供的語(yǔ)音輸入。

①打開(kāi)“控制面板—語(yǔ)音識(shí)別”(如下頁(yè)圖4)。

②點(diǎn)擊“啟動(dòng)語(yǔ)音識(shí)別”,進(jìn)行麥克風(fēng)設(shè)置。然后要設(shè)置是否啟用文檔審閱來(lái)讓計(jì)算機(jī)學(xué)習(xí)字詞和短語(yǔ),以便改進(jìn)計(jì)算機(jī)識(shí)別話語(yǔ)的能力;選擇激活模式等。最后可以啟動(dòng)語(yǔ)音教程,來(lái)學(xué)習(xí)一下如何進(jìn)行操作。在此之前,要保證麥克風(fēng)已經(jīng)能正常錄音。

③下面的“設(shè)置麥克風(fēng)”和“學(xué)習(xí)語(yǔ)音教程”是為了在第二步?jīng)]有做好時(shí)可以重新設(shè)置或?qū)W習(xí)。

④點(diǎn)擊“訓(xùn)練您的計(jì)算機(jī)以使其更了解您”,進(jìn)行一段十分鐘左右的訓(xùn)練。雖然這不是必需的,但建議你把它做完,只要對(duì)著麥克風(fēng)把相應(yīng)的內(nèi)容大聲朗讀完就可以。里面的內(nèi)容對(duì)如何使用語(yǔ)音識(shí)別有非常貼切的建議。

Windows7提供的語(yǔ)音識(shí)別不僅可以輸入文字,還可以用來(lái)控制計(jì)算機(jī)。比如可以說(shuō):“打開(kāi)記事本”,系統(tǒng)將自動(dòng)為你打開(kāi)記事本程序。我們可以通過(guò)“打開(kāi)語(yǔ)音參考卡片”來(lái)了解那些命令列表。

如果你的普通話比較標(biāo)準(zhǔn),麥克風(fēng)質(zhì)量過(guò)關(guān),使用得當(dāng),那么語(yǔ)音識(shí)別的效果還是不錯(cuò)的,經(jīng)過(guò)一段時(shí)間使用之后,正確率可以達(dá)到95%左右。

語(yǔ)音識(shí)別雖然在計(jì)算機(jī)文字輸入上還有很長(zhǎng)的路要走,但在移動(dòng)設(shè)備上正風(fēng)生水起,特別是在聊天等對(duì)正確率要求不是很高的場(chǎng)合,完全可以用語(yǔ)音識(shí)別來(lái)解放自己??梢韵胂?,當(dāng)語(yǔ)音識(shí)別技術(shù)得到突破的一天,可能鍵盤(pán)就不再是像現(xiàn)在這樣成為計(jì)算機(jī)的標(biāo)配了。

● 簡(jiǎn)易的手寫(xiě)輸入

部分特殊的人群,如一些老年人,既不會(huì)拼音,也背不下五筆字型字根,中文輸入成為使用計(jì)算機(jī)的一道難題。但購(gòu)買(mǎi)一塊幾十塊錢(qián)的手寫(xiě)板,就可以解決這個(gè)問(wèn)題。手寫(xiě)板一般是使用一只專(zhuān)門(mén)的筆,或者用手指在特定的區(qū)域內(nèi)書(shū)寫(xiě)文字。手寫(xiě)板通過(guò)各種方法將筆或者手指走過(guò)的軌跡記錄下來(lái),然后識(shí)別為文字。只要會(huì)寫(xiě)字,就能輸入漢字。

手寫(xiě)輸入還有一個(gè)好處,如果某個(gè)字你不會(huì)讀,也不會(huì)用五筆來(lái)拆分,那手寫(xiě)輸入就能幫上大忙了。如果只是偶然碰到不會(huì)輸入的漢字,可以不用專(zhuān)門(mén)買(mǎi)手寫(xiě)板來(lái)解決,在一些輸入法上就可以啟用手寫(xiě)輸入,用鼠標(biāo)來(lái)書(shū)寫(xiě)這個(gè)字,輸入法會(huì)進(jìn)行識(shí)別。如果你用的輸入法不提供手寫(xiě)輸入,還可以在網(wǎng)上搜索在線手寫(xiě)輸入,網(wǎng)頁(yè)會(huì)彈出一個(gè)窗口給你用鼠標(biāo)進(jìn)行書(shū)寫(xiě)(如下頁(yè)圖5),再識(shí)別你寫(xiě)的字,你只要把識(shí)別出來(lái)的字復(fù)制到要使用的地方就行了。

手寫(xiě)輸入因?yàn)樗俣忍?,只在一些特殊的人群范圍?nèi)使用,但對(duì)偶然解決一下輸入中的問(wèn)題還是很有用的。

● 快捷的文字識(shí)別

我們可能經(jīng)常碰到要把某些書(shū)籍雜志報(bào)紙或手寫(xiě)稿的內(nèi)容進(jìn)行數(shù)字化,也就是將其存儲(chǔ)在計(jì)算機(jī)里。最快捷的辦法是先將其掃描保存成圖片,然后用OCR軟件進(jìn)行識(shí)別。

所謂OCR(Optical Character

Recognition光學(xué)字符識(shí)別)也就是圖像文字識(shí)別技術(shù),是計(jì)算機(jī)輸入技術(shù)的一種,它通過(guò)模式識(shí)別將文字的圖像文件轉(zhuǎn)化為可編輯的文本文件,徹底改變了計(jì)算機(jī)紙介質(zhì)資料輸入的概念。OCR是使用電子設(shè)備(如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過(guò)檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別的方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程;即對(duì)文本資料進(jìn)行掃描,然后對(duì)圖像文件進(jìn)行分析處理,最終獲取文字及版面信息。

早在上世紀(jì)六七十年代,世界各國(guó)就開(kāi)始進(jìn)行OCR的研究,我國(guó)在上世紀(jì)70年代末開(kāi)始進(jìn)行漢字識(shí)別的研究,到1986年進(jìn)入一個(gè)實(shí)質(zhì)性的階段,不少單位有很多成熟的中文OCR產(chǎn)品推出。

和語(yǔ)音識(shí)別類(lèi)似,OCR也還做不到百分之百正確識(shí)別,因?yàn)闀?shū)寫(xiě)者的習(xí)慣或印刷品質(zhì)、掃描儀的掃描品質(zhì)、識(shí)別的方法、學(xué)習(xí)及測(cè)試的樣本等都會(huì)影響其正確率。經(jīng)過(guò)多年的研究,國(guó)內(nèi)OCR識(shí)別簡(jiǎn)體漢字差錯(cuò)率為萬(wàn)分之三,如果要求更高的精度需要投入更大的人工干預(yù),可以說(shuō)是非常實(shí)用的了。

漢王是國(guó)內(nèi)比較優(yōu)秀的OCR軟件公司,我們以漢王PDF OCR為例簡(jiǎn)要說(shuō)明文字識(shí)別的過(guò)程:①單擊菜單“文件—掃描”,對(duì)紙質(zhì)文件進(jìn)行掃描。如果已經(jīng)有文字的圖片文件,單擊“文件—打開(kāi)圖像”,選擇相應(yīng)的圖片文件,也可以是由圖片轉(zhuǎn)換而來(lái)的PDF文件。②如果打開(kāi)的圖片有些傾斜,單擊“編輯—自動(dòng)傾斜校正”,校正完如果效果不好,單擊“編輯—手動(dòng)傾斜校正”,將圖片調(diào)整好。③單擊菜單“識(shí)別—版面分析”,軟件將自動(dòng)對(duì)圖片中的各個(gè)元素進(jìn)行分割,將元素分類(lèi)為圖像、橫欄、豎欄、表格四種。如果不準(zhǔn)確,可以拖動(dòng)鼠標(biāo)修改區(qū)域,或者增刪區(qū)域。④單擊菜單“識(shí)別—開(kāi)始識(shí)別”,軟件將對(duì)圖片上的各個(gè)元素自動(dòng)識(shí)別。⑤對(duì)比識(shí)別結(jié)果和圖片處的異同,修改識(shí)別錯(cuò)誤的文字。⑥單擊菜單“輸出—到指定格式文件”,將文本輸出到純文本文件(TXT)或富文本文件(RTF)。如果是單純的表格,也可以輸出到電子表格文件(XLS)。其界面如圖6所示。

● 神奇的腦電波輸入

如果一個(gè)人手腳不能動(dòng),不能說(shuō)話,還能操作計(jì)算機(jī)嗎?答案是肯定的。我們來(lái)看看最傳奇的科學(xué)家霍金是如何使用計(jì)算機(jī)輸入的(如圖7)。

霍金在21歲時(shí)就患上肌萎縮側(cè)索硬化癥,1985年因患肺炎做了穿氣管手術(shù),被徹底剝奪了說(shuō)話的能力?;艚鹱畛跏褂玫氖荳altosz開(kāi)發(fā)的軟件Word+,計(jì)算機(jī)安裝在輪椅上,他使用一種特制的開(kāi)關(guān)來(lái)輸入內(nèi)容。使用Word+軟件,光標(biāo)會(huì)在屏幕上一行一行掃描,經(jīng)過(guò)某個(gè)單詞或字母時(shí),霍金按下開(kāi)關(guān),單詞或字母就會(huì)出現(xiàn)在屏幕下方,反復(fù)進(jìn)行,就可以輸入整個(gè)句子和文章。

2008年,霍金的手已經(jīng)無(wú)法按下開(kāi)關(guān),于是在他的眼鏡上安裝了負(fù)責(zé)偵測(cè)肌肉活動(dòng)的紅外線發(fā)射器及偵測(cè)器。他動(dòng)下臉上的肌肉,前面的屏幕上就會(huì)出現(xiàn)字幕,當(dāng)他需要字母時(shí),再動(dòng)下,屏幕上就會(huì)出現(xiàn)這個(gè)字母開(kāi)關(guān)的單詞。這和用手控制開(kāi)關(guān)類(lèi)似,每分鐘可以輸入5~6個(gè)單詞。

2012年,霍金的肌肉已經(jīng)不太靈活,眼瞼下垂,連眼球也無(wú)法追蹤。美國(guó)的腦神經(jīng)科學(xué)家設(shè)計(jì)了一款腦電波讀取設(shè)備iBranin。字母在屏幕出現(xiàn),當(dāng)霍金想選中單詞時(shí),停止大腦的反應(yīng),設(shè)備就可以監(jiān)測(cè)、提取出來(lái)這個(gè)字母或單詞。當(dāng)然可以想象,這種方式輸入文字,速度和正確率是很低的。但是,只要?jiǎng)觿?dòng)腦子就可以使用計(jì)算機(jī),將使得無(wú)數(shù)殘疾人受益。Wadsworth Center的腦損傷研究者Jonathan Wolpaw最近正在開(kāi)發(fā)計(jì)算機(jī)-大腦用戶界面系統(tǒng)。這套系統(tǒng)可以讓癱瘓的人,通過(guò)計(jì)算機(jī)屏幕與親朋好友溝通,操作也極其簡(jiǎn)單:第一步,戴上類(lèi)似泳帽一樣的腦波信號(hào)收集器;第二步,讓他在一堆字母中,集中注意力于其中一個(gè),于是一個(gè)字母就會(huì)顯示在屏幕上。雖然現(xiàn)在打字速度還比較慢,但這也代表了交互越來(lái)越簡(jiǎn)單、越來(lái)越自然的趨勢(shì)。

科技是如此神奇。我們不妨狂想一下,在將來(lái)用于腦電波進(jìn)行輸入可能會(huì)在普通人中普及。在頭皮中植入一個(gè)小小的芯片,意念有多快,輸入就有多快。意念可以控制計(jì)算機(jī),以后我們也許不再需要血肉之軀,每個(gè)人都可以像變形金剛一樣,可以自由選擇身體的形狀。如果意念可以轉(zhuǎn)移,人也就可以永生了。這也許是科技的終極夢(mèng)想。

猜你喜歡
輸入法鍵盤(pán)語(yǔ)音
你知道手機(jī)撥號(hào)鍵盤(pán)上為什么要有*和#嗎?
要命的輸入法
鍵盤(pán)貓
Cлово месяца
魔力語(yǔ)音
ikbc R300機(jī)械鍵盤(pán)
基于MATLAB的語(yǔ)音信號(hào)處理
電子制作(2019年14期)2019-08-20 05:43:38
基于MQ3與MP3的價(jià)廉物美的酒駕語(yǔ)音提醒器
電子制作(2019年9期)2019-05-30 09:42:10
對(duì)方正在輸入……
百度被訴侵犯商標(biāo)權(quán)和不正當(dāng)競(jìng)爭(zhēng)
葵青区| 呈贡县| 建德市| 达尔| 宜兴市| 桃江县| 米林县| 三原县| 潢川县| 临猗县| 绥化市| 巴彦淖尔市| 米易县| 靖江市| 边坝县| 博兴县| 弥渡县| 大安市| 古丈县| 罗定市| 霸州市| 山阴县| 乌拉特中旗| 五大连池市| 商河县| 平阴县| 开原市| 伊金霍洛旗| 博爱县| 东阳市| 濉溪县| 芷江| 恩施市| 涡阳县| 博乐市| 乳源| 常州市| 舒兰市| 辛集市| 偃师市| 万安县|