一畝地
數(shù)據(jù)標注是AI(人工智能)實現(xiàn)的基石,特別是ChatGPT的橫空出世,把AI的熱度推向了一個新的巔峰,那么作為整個AI產(chǎn)業(yè)鏈的基礎(chǔ)層支撐之一,數(shù)據(jù)標注自然也不能被忽視。
行業(yè)現(xiàn)狀
2020年,人工智能訓(xùn)練師被正式納入國家職業(yè)分類目錄。一般來說,人工智能訓(xùn)練師主要分為數(shù)據(jù)標注員和人工智能算法測試員。數(shù)據(jù)標注從業(yè)人員在業(yè)內(nèi)有“AI民工”的稱號,由此不難看出數(shù)據(jù)標注屬于勞動密集型產(chǎn)業(yè),具有機械性、重復(fù)性的特點,而此類工作正是AI要取代的方向。如此看來,數(shù)據(jù)標注行業(yè)似乎有種“舍身飼虎”的感覺。
其實不然,目前主流的機器學(xué)習(xí)方式以有監(jiān)督的深度學(xué)習(xí)方式為主,對于標注數(shù)據(jù)有著強依賴性需求。且不說當前AI的火熱會帶動數(shù)據(jù)標注需求短時間內(nèi)增長,從長久來看,人類社會的發(fā)展是一個動態(tài)的過程,世界更是千變?nèi)f化,從中采集的數(shù)據(jù)自然也不會是一成不變的,而AI要進化,就需要不斷地識別和學(xué)習(xí)經(jīng)過清洗、處理而成的結(jié)構(gòu)化數(shù)據(jù)。所以,只要AI存在一天,數(shù)據(jù)標注就不會消亡。
好馬喂好料
如果把AI當作一匹馬,隨著越來越多的AI應(yīng)用落地,現(xiàn)在的AI市場儼然一幅萬馬奔騰的畫面,要想在AI市場脫穎而出,唯有升級為“千里馬”。俗話說“好馬喂好料”,縱有算法千般好,沒有好的數(shù)據(jù)供其訓(xùn)練也只能“才美不外見”,這就對數(shù)據(jù)標注行業(yè)提出了更高的要求。相比以往的低門檻,今后的數(shù)據(jù)標注從業(yè)人員需要具備更加專業(yè)的知識。如發(fā)展醫(yī)療、法律、金融、工業(yè)等專業(yè)化水平較高的AI技術(shù),就需要具備一定專業(yè)知識的人進行數(shù)據(jù)標注工作。在這方面,大型的工廠式數(shù)據(jù)標注公司在技術(shù)儲備、人員培訓(xùn)方面的優(yōu)勢就得以顯現(xiàn),會進一步擠壓中小型工作室的生存空間。
有多少人工就有多少智能
AI行業(yè)有一句話“有多少人工就有多少智能”,在ChatGPT獨領(lǐng)風(fēng)騷、AI概念高熱不退的當下,仍有成千上萬的AI訓(xùn)練師做著枯燥的流水線式標注工作。他們多就職于三四線城市的中小型工作室(人數(shù)由幾十人到幾百人不等),收入較低,難以獲得福利保障。他們多數(shù)學(xué)歷較低、就業(yè)競爭優(yōu)勢不大,其中不乏殘障人士等無法從事正常工作的特殊群體,而且他們又極有可能是AI在數(shù)據(jù)標注行業(yè)最先取代的人。
與大型公司相比,工作室能接到的項目資源通常不穩(wěn)定,且經(jīng)過層層轉(zhuǎn)包,到了最后一層,自然沒有多少利潤,也導(dǎo)致了從業(yè)人員的薪資普遍較低。究其原因,是數(shù)據(jù)標注行業(yè)發(fā)展粗放、缺乏規(guī)范。今后數(shù)據(jù)標注的標準會更高,競爭也會愈發(fā)激烈,數(shù)據(jù)標注公司需要去思考怎樣提高效率、培訓(xùn)員工、規(guī)范行業(yè),以及承擔更多的社會責(zé)任。
結(jié)語
發(fā)展科學(xué)技術(shù)的根本目的是解放生產(chǎn)力,把人類從繁重的體力勞動中解放出來。數(shù)據(jù)標注和算法研究一樣為AI行業(yè)發(fā)光發(fā)熱,為人類美好的明天做出貢獻。