国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人體輔助,AI 落地的另一種可能

2020-06-12 07:12李慕陽(yáng)
科海故事博覽 2020年1期
關(guān)鍵詞:手語(yǔ)人士語(yǔ)音

文/李慕陽(yáng)

人體輔助是一條被忽略的垂直賽道,產(chǎn)品和商業(yè)模式卻非常清晰,討論這一公益領(lǐng)域的商業(yè)構(gòu)成本身并不違和。近期,《時(shí)代周刊》公布了2019年的100項(xiàng)最佳發(fā)明。最引人注目的一欄是“Accessibility”,人體輔助功能。這一項(xiàng)目里,由會(huì)說(shuō)話的AI 助聽(tīng)器、眼控技術(shù)、智能手杖、智能假肢、視聽(tīng)轉(zhuǎn)換等。當(dāng)人工智能還是很多上市公司哄抬的概念、vc 口中的風(fēng)口、專(zhuān)家手中的炫技、自媒體們筆下渲染的惶恐未來(lái)時(shí),有一些人已經(jīng)開(kāi)始做出實(shí)際的行動(dòng),瞄準(zhǔn)的是一個(gè)痛得不能再痛的垂直痛點(diǎn)。在大洋的另一端的中國(guó),同樣的項(xiàng)目和故事開(kāi)始上演,先來(lái)看兩個(gè)案例。

看不清的公眾號(hào)運(yùn)營(yíng)

小雨是一個(gè)配音演員,患有視力障礙,平日里卻在運(yùn)營(yíng)微信公眾號(hào),這是如何做到的?曾幾何時(shí),小雨是一個(gè)風(fēng)華正茂、前途一片光明的大學(xué)生,彈了10多年鋼琴,正在考駕照,愛(ài)好戲劇和表演,喜歡畫(huà)水彩,對(duì)未來(lái)充滿想象。但是命運(yùn)卻在剎那急轉(zhuǎn),起因是瞳孔出血,接著是一次小手術(shù)的失敗引發(fā)了不可逆轉(zhuǎn)的后果,作為一個(gè)彈慣了肖邦莫扎特、心靈手巧的女孩子,忽然間鋼琴上的按鍵她一個(gè)都看不清了,那一年她才19歲。小雨是不幸的,但是她很倔強(qiáng)。在混沌迷茫的世界里,她依然保持著搜羅各種劇本的愛(ài)好,開(kāi)始給其中的人物配音,但是劇本上密密麻麻的小字,如何看得清?好在一些屏幕閱讀軟件可以把文字轉(zhuǎn)化成聲音,這樣她每一個(gè)新奇的點(diǎn)子都不會(huì)忘掉了。就這樣,在視覺(jué)墮入混沌之后,“聲音文字的互轉(zhuǎn)”成了她和世界交互的關(guān)鍵紐帶。她給動(dòng)漫配音的事業(yè)很快走上軌道,一邊運(yùn)營(yíng)起了視障主題的公眾號(hào),她還是那個(gè)激情洋溢的女孩,她很堅(jiān)強(qiáng)。這是一個(gè)溫暖的案例。在中國(guó),大約有6000萬(wàn)肢體障礙、視力障礙和聽(tīng)力障礙者,更廣義的殘障人群則達(dá)到了總?cè)丝诘?%。人工智能技術(shù)正在幾個(gè)方向上迅速突破,致力于解決他們面臨的核心問(wèn)題:一是如何讓他們看見(jiàn)?通過(guò)文字識(shí)別技術(shù),看不清的文字都可以轉(zhuǎn)為語(yǔ)音。通過(guò)圖像識(shí)別技術(shù),看不清的人或事也可以轉(zhuǎn)化為語(yǔ)音的描述;二是如何讓他們書(shū)寫(xiě)?通過(guò)語(yǔ)音語(yǔ)義的識(shí)別,他們的聲音可以轉(zhuǎn)換成文字;三是如何讓他們更方便地生活?這里有很多細(xì)節(jié)。比如常見(jiàn)的網(wǎng)站登錄圖像驗(yàn)證,需要滑動(dòng)拼圖驗(yàn)證碼,他們?cè)趺崔k?常見(jiàn)的人臉識(shí)別需要眨眼睛,他們?cè)趺崔k?當(dāng)然,這些技術(shù)在發(fā)展中依然面臨諸多困境,文字識(shí)別往往需要視障人士拍照聚焦、可他們?cè)趺淳劢梗亢芏嗖灰?guī)范的手寫(xiě)字能不能識(shí)別出來(lái)?語(yǔ)音語(yǔ)義的識(shí)別能否絕對(duì)準(zhǔn)確,方言能不能聽(tīng)得懂?

聽(tīng)不見(jiàn)的三辯

在廣東,殘障人士有一個(gè)練習(xí)溝通表達(dá)的表達(dá)社,表達(dá)社里出了一個(gè)“最佳辯手”,這個(gè)男生擔(dān)綱三辯,可以和正常人唇槍舌劍,盡管他是一個(gè)聽(tīng)力障礙人士,聽(tīng)不見(jiàn)任何聲音。聽(tīng)不見(jiàn)任何聲音,包括自己的說(shuō)話聲,如何與常人辯論呢?換一個(gè)角度說(shuō),在中國(guó)約有2.1億人患有聽(tīng)力障礙,其中7200萬(wàn)人患有中等以上聽(tīng)力障礙,通過(guò)助聽(tīng)器、人工耳蝸獲得有效助聽(tīng)服務(wù)的只有2.5%。好在AI 迅猛發(fā)展,人們有了很多辦法,比如開(kāi)發(fā)專(zhuān)業(yè)的聽(tīng)力障礙APP,可以有這樣的功能:一是字幕聊天,別人說(shuō)的話(線下、視頻)可以即時(shí)轉(zhuǎn)化為文字,這樣一來(lái)就交流無(wú)障礙了;二是語(yǔ)言康復(fù)訓(xùn)練,通過(guò)語(yǔ)音識(shí)別、合成和評(píng)測(cè),幫助聽(tīng)障人士重新開(kāi)口,練習(xí)普通話,通過(guò)拼音、詞語(yǔ)、句子、文章循序漸進(jìn)。比如廣州的這位最佳辯手,就是通過(guò)專(zhuān)門(mén)的APP 實(shí)現(xiàn)了與正常人的話語(yǔ)交鋒,對(duì)方辯友的聲音都第一時(shí)間轉(zhuǎn)化為文字,而長(zhǎng)期語(yǔ)言康復(fù)訓(xùn)練的他已經(jīng)可以直接“回懟”了。即便張開(kāi)口來(lái),聲音還不夠標(biāo)準(zhǔn)、自然,但這已經(jīng)是非常了不起的一步了。圍繞這個(gè)人群,還有另一個(gè)困境:聾啞人士常常通過(guò)手語(yǔ)交流,但是對(duì)普通大眾來(lái)說(shuō),手語(yǔ)有如天書(shū)。在美國(guó),手語(yǔ)翻譯的比例是1:120,但是在中國(guó),這個(gè)比例遠(yuǎn)遠(yuǎn)小于1:10000。這樣一個(gè)痛點(diǎn)該怎么解決?國(guó)內(nèi)的公司已經(jīng)進(jìn)行了很多探索,一個(gè)解決方案是智能手環(huán),聾啞人士戴上后,手環(huán)可以自動(dòng)識(shí)別跟蹤人手的肌肉信號(hào),把手勢(shì)轉(zhuǎn)化為文字和動(dòng)圖。但是面前有兩大疑難:一是需要龐大的手語(yǔ)數(shù)據(jù)庫(kù),這不是一朝一夕可以完成的;二是如何適應(yīng)聾人手語(yǔ)與眾不同的語(yǔ)序,如何區(qū)分同一動(dòng)作在不同語(yǔ)境和表情下的不同含義,是否引入自然語(yǔ)言處理的算法?

人體輔助的場(chǎng)景分析

在《時(shí)代周刊》的榜單中,可以看到這樣一些案例:orcam myeye2這樣的輔助攝像頭,可以直接夾在用戶的眼鏡上,只要用手指指向想看的東西,設(shè)備就可以讀取上面的內(nèi)容,不僅有文字,還可以識(shí)別人臉和物體顏色。wewlk 智能手杖內(nèi)置傳感器、揚(yáng)聲器、語(yǔ)音助手和導(dǎo)航,還能用超聲波檢測(cè)胸部上方的障礙物并震動(dòng)警告。智能假肢更是將腦機(jī)接口推向落地,用戶可以直接像手一樣控制,且假手具備感知能力和自主智能。樹(shù)洞行動(dòng)發(fā)起人黃智生說(shuō):“人工智能技術(shù)的進(jìn)步所取得的經(jīng)濟(jì)效益要充分導(dǎo)流到弱勢(shì)群體那邊,讓他們充分受益?!睔堈先耸渴遣恍业?,命運(yùn)無(wú)情地剝奪了他們與常人共處的一些能力。但萬(wàn)幸在這個(gè)時(shí)代,人工智能技術(shù)的突進(jìn)正在打破藩籬、填平溝壑,于是一些歷史上不可想象的事情發(fā)生了。其一,文字轉(zhuǎn)語(yǔ)音,圖像識(shí)別轉(zhuǎn)語(yǔ)音,視覺(jué)障礙人士可以“聽(tīng)到”更多了;其二,語(yǔ)音轉(zhuǎn)文字,手勢(shì)轉(zhuǎn)語(yǔ)音,聾啞人士可以與正常人交流了;其三,對(duì)于肢體殘障人士,智能聲控輪椅正在成為一種新的可能。圍繞“無(wú)障礙”的目標(biāo),人工智能領(lǐng)域的大公司在行動(dòng)。騰訊發(fā)起“信息無(wú)障礙”行動(dòng),視障用戶可以用聲紋加好友,圖片語(yǔ)音描述功能可以幫助他們“看見(jiàn)”圖片,并且圍繞語(yǔ)言障礙人士身份認(rèn)證需求優(yōu)化粵事省小程序。阿里發(fā)布助殘報(bào)告,17萬(wàn)殘疾人在淘寶天貓開(kāi)店,3年銷(xiāo)售額近300億,阿里巴巴達(dá)摩院與清華大學(xué)人機(jī)交互實(shí)驗(yàn)室推出了為視障者研發(fā)的智能手機(jī)膜。2017年以來(lái),科大訊飛發(fā)布了“三聲有幸”公益計(jì)劃,從資金到技術(shù),對(duì)涉及殘障人士的項(xiàng)目進(jìn)行扶持,對(duì)很多語(yǔ)音文字交互的項(xiàng)目無(wú)保留地開(kāi)放底層技術(shù)。在1024開(kāi)發(fā)者節(jié)上,相關(guān)的技術(shù)和案例展示感動(dòng)了很多人。在國(guó)外,亞馬遜、谷歌和蘋(píng)果的智能音箱成為殘障人士的福音,自動(dòng)駕駛的技術(shù)推進(jìn)也為殘疾人的出行帶來(lái)了新的助力?!半m殘不障”正在成為現(xiàn)實(shí),但是這一進(jìn)程的演進(jìn)仍然緩慢,人體輔助是一條被忽略的垂直賽道,產(chǎn)品和商業(yè)模式卻非常清晰,討論這一公益領(lǐng)域的商業(yè)構(gòu)成本身并不違和。從市場(chǎng)前景看,基于AI 的人體輔助是康復(fù)醫(yī)療行業(yè)的未來(lái)。據(jù)預(yù)測(cè),2022年康復(fù)醫(yī)療行業(yè)的市場(chǎng)規(guī)模將達(dá)到1033億元。從需求和產(chǎn)品模式看,人體輔助的解決方案正在迅速成熟,針對(duì)的就是殘障人士日常生活溝通的需求和痛點(diǎn),更像是盲杖、助聽(tīng)器和義肢的智能升級(jí),其使用效果伴隨著數(shù)據(jù)積累和算法迭代不斷升級(jí)。從行業(yè)前景看,殘障人士的“殘而不障”將與更多的新技術(shù)結(jié)合,與物聯(lián)網(wǎng)技術(shù)結(jié)合帶來(lái)更多的智能硬件和可穿戴設(shè)備,與機(jī)器人技術(shù)結(jié)合帶來(lái)更多的陪伴和康復(fù)機(jī)器人,與VR結(jié)合實(shí)現(xiàn)更多的情境模擬訓(xùn)練。當(dāng)然,基于AI 的人體輔助也面臨著比較顯著的問(wèn)題:涉及的算法和數(shù)據(jù)要求較高,不是一般創(chuàng)業(yè)公司可以hold 住的。或許一個(gè)比較好的模式是:由政府牽頭、大公司參與,去完成一些底層基礎(chǔ)設(shè)施和數(shù)據(jù)庫(kù)的構(gòu)建,比如語(yǔ)音圖像手勢(shì)的底層數(shù)據(jù)、語(yǔ)義分析的算法,并對(duì)外開(kāi)源,比如訊飛、百度的開(kāi)放平臺(tái);由更加垂直的創(chuàng)業(yè)公司去深挖,研發(fā)出更多兼具針對(duì)性和價(jià)格低廉的解決方案。

猜你喜歡
手語(yǔ)人士語(yǔ)音
新的社會(huì)階層人士統(tǒng)戰(zhàn)工作實(shí)現(xiàn)創(chuàng)新發(fā)展呈現(xiàn)嶄新局面
“智慧谷”搭建海外人士創(chuàng)新創(chuàng)業(yè)“新”橋梁
新的社會(huì)階層人士發(fā)展趨勢(shì)、挑戰(zhàn)及組織策略
WHEELS IN MOTION
自然手語(yǔ)在聾人大學(xué)生手語(yǔ)中的使用調(diào)查研究——以南京特殊教育師范學(xué)院為例
魔力語(yǔ)音
基于MATLAB的語(yǔ)音信號(hào)處理
基于MQ3與MP3的價(jià)廉物美的酒駕語(yǔ)音提醒器
無(wú)聲的世界里,怎樣唱一首歌?
對(duì)方正在輸入……