摘要:[目的/意義] 生成式預(yù)訓(xùn)練聊天模型ChatGPT火爆出圈,通過人工智能生產(chǎn)內(nèi)容,為企業(yè)的知識管理打開一扇新的大門。[方法/過程] 通過研究ChatGPT的緣起及發(fā)展,梳理其與知識管理的關(guān)系,并分析它對知識管理者產(chǎn)生的影響。[結(jié)果/結(jié)論] ChatGPT及其同類產(chǎn)品將促使知識管理界生產(chǎn)重大變化,知識管理相關(guān)從業(yè)者應(yīng)該未雨綢繆,積極應(yīng)變,投身于其中并與之共舞。
關(guān)鍵詞:ChatGPT;知識管理;人工智能;AIGC;內(nèi)容生成
分類號:G203
引用格式:吳慶海. ChatGPT將對知識管理界帶來怎樣的影響?[J/OL]. 知識管理論壇, 2022, 8(4): 273-277[引用日期]. http://www.kmf.ac.cn/p/350/.
火爆全網(wǎng)的ChatGPT出圈后,“忽如一夜春風(fēng)來,千樹萬樹梨花開”。
微軟的“New Bing”及“Copilot”[1]、百度的“文心一言”[2]、360的“智腦”[3]、阿里巴巴的“通義千問”[4]、金山辦公的“WPS AI”[5]等大模型應(yīng)用紛紛發(fā)布,開始邀請用戶測試體驗(yàn)。而華為的“盤古”NLP模型、科大訊飛的“1+N”認(rèn)知智能大模型等,也放出聲音即將發(fā)布。
現(xiàn)如今,在聚會飯局上,如果不聊兩句ChatGPT,都感覺似乎已經(jīng)脫離時(shí)代了。在筆者負(fù)責(zé)的一個(gè)知識管理咨詢項(xiàng)目中,客戶的高層管理者在年前就點(diǎn)名要重點(diǎn)研究一下ChatGPT。身邊不時(shí)有一些朋友,會問ChatGPT對知識管理有何影響之類的問題,因此,筆者現(xiàn)就ChatGPT與知識管理的話題談?wù)勛约旱恼J(rèn)識。
1? ChatGPT的緣起
ChatGPT,英文全名為Chat Generative Pre-trained Transformer,中文可直譯為“生成式預(yù)訓(xùn)練聊天模型”。
它是美國人工智能研究實(shí)驗(yàn)室OpenAI推出的人工智能模型,可以通俗理解為一款聊天機(jī)器人程序。
2022年11月30日,ChatGPT-3.5一經(jīng)推出就一炮而紅,短短2個(gè)月用戶破億,成為歷史上增長最快的消費(fèi)類應(yīng)用。
2023年3月15日,OpenAI推出了多模態(tài)ChatGPT-4.0這一最新版本,它具有更加逼真和自然的文本生成、更加準(zhǔn)確的語言理解和更加高效的模型訓(xùn)練等特點(diǎn)。
ChatGPT這款聊天神器表現(xiàn)得如此“聰慧”,智商情商全程在線,上知天文,下知地理,有料有趣,讓人不由沉溺其中。
與之前蘋果Siri、小度等各類客服機(jī)器人“傻傻”聊天不同,ChatGPT能讓人感覺它似乎真的具有人的一些智慧。
它能告訴你答案,能理解調(diào)侃你,能幫你寫文章,甚至在情緒處理、藝術(shù)表達(dá)、技術(shù)實(shí)現(xiàn)、科學(xué)研究等諸多之前“人類獨(dú)占”的領(lǐng)域表現(xiàn)也不差。
ChatGPT為什么會如此出色?
這得益于機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、Transformer模型等多種技術(shù)的積累和疊加。ChatGPT本質(zhì)上是將海量的數(shù)據(jù)與表達(dá)能力強(qiáng)的Transformer模型結(jié)合,從而對自然語言進(jìn)行了一個(gè)非常有深度的建模。
技術(shù)路線上,ChatGPT在GPT-3.5大規(guī)模語言模型基礎(chǔ)上,引入“人工標(biāo)注數(shù)據(jù)+強(qiáng)化學(xué)習(xí)”,并能不斷微調(diào)預(yù)訓(xùn)練語言模型。
從ChatGPT官網(wǎng)發(fā)布的資料來看,其訓(xùn)練的3個(gè)階段具體如下(見圖1)[6]:
(1)第一步:收集演示數(shù)據(jù)并訓(xùn)練監(jiān)督策略(supervised policy)。
(2)第二步:收集對比數(shù)據(jù)并訓(xùn)練獎勵模型(reward model)。
(3)第三步:采用近端策略優(yōu)化PPO(proximal policy optimization)強(qiáng)化學(xué)習(xí)算法優(yōu)化策略并更新獎勵模型。
通過人工標(biāo)注后進(jìn)行訓(xùn)練,使得GPT模型快速迭代升級,從GPT-1、GPT-2、GPT-3,到GPT-3.5,形成了知識增強(qiáng)千億參數(shù)大模型,而GPT-4參數(shù)規(guī)模據(jù)說達(dá)6 000億。
有意思的是,國內(nèi)硬核科幻大片《流浪地球2》恰在2023年春節(jié)期間上映,許多人已經(jīng)被其中的超級人工智能MOSS系統(tǒng)種草,科幻與現(xiàn)實(shí)相映,不由讓人浮想聯(lián)翩。
2? ChatGPT與知識管理的關(guān)系
知識管理有多種定義和說法,但萬變不離其宗,都是在一個(gè)范疇內(nèi),通過對知識進(jìn)行高效的識別、創(chuàng)造、獲取、存儲、共享及應(yīng)用,最終創(chuàng)造價(jià)值。
那么,ChatGPT及其同類產(chǎn)品,與知識管理有什么關(guān)系呢?
2.1? ChatGPT本身就是知識管理的一個(gè)具體的結(jié)果呈現(xiàn)
ChatGPT是一種大規(guī)模預(yù)訓(xùn)練語言模型LLM(large language model),它的基礎(chǔ)需要學(xué)習(xí)大量的知識,使用海量的語料進(jìn)行預(yù)訓(xùn)練。
這些語料庫通常來自互聯(lián)網(wǎng)上公開可用的數(shù)據(jù)、文本、源代碼等知識(如Wikipedia、Common Crawl等),GPT-3.5的語料庫具有8 000億單詞、45TB文本數(shù)據(jù)的規(guī)模。
計(jì)算機(jī)科學(xué)家S. Wolfram在解釋ChatGPT的工作原理時(shí)[7],舉過一個(gè)例子,例如輸入文本“AI最好之處在于它()的能力”,為了補(bǔ)充括號中的內(nèi)容,ChatGPT會在數(shù)十億個(gè)網(wǎng)頁中查找類似的文本,統(tǒng)計(jì)下一個(gè)單詞出現(xiàn)的概率。最終,ChatGPT會生成一個(gè)可能的單詞列表,并給出每個(gè)單詞的概率排名。
由此可見,如果沒有前人海量知識內(nèi)容的支撐,ChatGPT想要高質(zhì)量地生成內(nèi)容,是不可能的。
2.2? ChatGPT對知識管理是一個(gè)極大的刺激和推動
企業(yè)知識管理推動者,一般都會面臨一個(gè)巨大的挑戰(zhàn),即如何向別人解釋或證明知識管理的價(jià)值。
現(xiàn)在,ChatGPT無比直觀地、全方位地呈現(xiàn)出了這種價(jià)值,能夠展示出知識在具體場景、具體問題中,被直接應(yīng)用后臨門一腳所發(fā)揮的威力。
每當(dāng)筆者向客戶演示ChatGPT類的產(chǎn)品時(shí),看到的人都會忍不住地激動起來,現(xiàn)場回答一個(gè)問題,即興撰寫一個(gè)文案,是如此輕松順滑,與過去咬文嚼字式的知識生產(chǎn)相對比,太具有顛覆性了。
如果我們企業(yè)的知識庫也能夠達(dá)到ChatGPT的水平,那么所解決的問題、提升的效率、節(jié)省的時(shí)間,該有多么巨大的想象空間啊。
有人分析,未來那些具有重復(fù)性和高度制式化的工作,可能會被數(shù)字化和機(jī)器人取代。諸如客服人員、翻譯工作者、新聞編輯、程序員、行政助理、市場分析師、金融分析師、平面設(shè)計(jì)師、會計(jì)師等職業(yè),都存在被ChatGPT取代的風(fēng)險(xiǎn)。
當(dāng)然,一些全新的工作也會涌現(xiàn)出來,與ChatGPT緊密相關(guān)的預(yù)訓(xùn)練模型、對話機(jī)器人、人工智能生成內(nèi)容(AI-generated content, AIGC)領(lǐng)域的人才會變得炙手可熱。
那些需要高度定制化、個(gè)性化、創(chuàng)造力、同理心、審美、綜合專業(yè)知識的職業(yè),諸如資深顧問、頂級藝術(shù)家、外科醫(yī)生、科學(xué)家、管理者、老中醫(yī)等,會變得更有價(jià)值。
所以說,真正能夠淘汰你的,不是競爭對手,而是時(shí)代的發(fā)展和科技的進(jìn)步。
2.3? ChatGPT為知識管理提供了一個(gè)威力無比的工具
企業(yè)在實(shí)施知識管理時(shí),總會碰到一個(gè)特別大的難題——如何讓員工多、快、好、省地產(chǎn)生內(nèi)容。我們大多數(shù)人寫東西時(shí)都會發(fā)怵。即使是優(yōu)秀的內(nèi)容創(chuàng)作者,也會不時(shí)遇到文思枯竭的瓶頸期。
過去,無論是用戶產(chǎn)生內(nèi)容UGC(user-generated content)、專業(yè)生產(chǎn)內(nèi)容PGC(professionally-generated content)、職業(yè)生產(chǎn)內(nèi)容OGC(occupationally-generated content),都是由人來產(chǎn)生內(nèi)容的。
現(xiàn)在,則多了一種新的內(nèi)容產(chǎn)生方式——AIGC,有了ChatGPT這種神器自動產(chǎn)生內(nèi)容,讓機(jī)器幫忙寫東西,這是多么美好的一件事情啊!
ChatGPT為知識管理,無疑打開了一扇新的大門,啟發(fā)從業(yè)者運(yùn)用全新的思維去推動知識管理。
例如,ChatGPT能自動化處理大量的文本,可用于自動化報(bào)告的生成、自動化文本分類、智能搜索和答案生成等,從而提高知識管理的效率和準(zhǔn)確性;ChatGPT可以根據(jù)用戶的輸入和反饋不斷學(xué)習(xí)和優(yōu)化,可以根據(jù)用戶的個(gè)性化需求和興趣來生成和推薦文本,從而提高知識管理的個(gè)性化和用戶體驗(yàn)。
百度掌門人李彥宏認(rèn)為:“未來10年,AIGC將顛覆現(xiàn)有內(nèi)容生產(chǎn)模式,可以實(shí)現(xiàn)以十分之一的成本、以百倍千倍的生產(chǎn)速度,去生成AI原創(chuàng)內(nèi)容。”[8]
3? 知識管理者應(yīng)該做哪些準(zhǔn)備
目前,ChatGPT主要服務(wù)的還是消費(fèi)者(C端用戶),距離企業(yè)(B端用戶)的應(yīng)用似乎還有些遙遠(yuǎn)。
但是這?!白訌棥?,卻已擊中各個(gè)行業(yè)一些具有前瞻性思維的大腦,接下來必然會產(chǎn)生一系列的連鎖反應(yīng),出現(xiàn)多米諾骨牌效應(yīng),引起新一輪的產(chǎn)業(yè)洗牌。知識管理者應(yīng)該未雨綢繆,做好如下的一些準(zhǔn)備:
3.1? 盡快構(gòu)建屬于自己行業(yè)垂直領(lǐng)域的知識庫
之前,多數(shù)人都會承認(rèn)知識管理的重要性,但是卻忽視了知識管理的迫切性。知識管理到底是“錦上添花”還是“雪中送炭”,往往爭論不休,莫衷一是。
但是有了ChatGPT,可以預(yù)見未來一定會打通所有的知識網(wǎng)絡(luò)。
ChatGPT及其同類產(chǎn)品再強(qiáng)大,但是它還是會缺乏各個(gè)行業(yè)、各個(gè)公司垂直的知識語料,這些內(nèi)容往往是企業(yè)專屬的,不會在互聯(lián)網(wǎng)上被公開查找到。
各個(gè)公司要開始準(zhǔn)備構(gòu)建專業(yè)的知識庫、百科庫、問答庫、案例庫等。如果不早點(diǎn)梳理、構(gòu)建自己的領(lǐng)域知識,就不會盡早擁有自己的ChatGPT。沒有專業(yè)知識的喂養(yǎng),也無法形成專業(yè)領(lǐng)域的ChatGPT。
我們可以稱這些工作為“知識基建”,這涉及知識體系的架構(gòu)與設(shè)計(jì)、知識庫軟件系統(tǒng)的開發(fā)與部署、存量知識的梳理與導(dǎo)入、新增知識的生產(chǎn)與沉淀等,這些基建工作都需要一步一個(gè)腳印,扎扎實(shí)實(shí)地做好。
3.2? 有意識地向知識智能化的方向進(jìn)行不斷探索
在規(guī)劃知識管理軟件系統(tǒng)時(shí),可以依循“線上化-場景化-智能化”的邏輯次第升級。
(1)線上化:以知識歸類存儲為核心,聚焦知識收集,通過知識庫構(gòu)建、知識分類、知識搜索等,搭建知識沉淀的基礎(chǔ)平臺。
(2)場景化:以知識提煉整合為核心,聚焦業(yè)務(wù)場景,通過知識聚合、知識地圖、知識圖譜、系統(tǒng)集成等,提升知識應(yīng)用的層次。
(3)智能化:以知識智能服務(wù)為核心,聚焦智能創(chuàng)造,通過AI智能寫作、AI智能問答、AI智能助理等,進(jìn)一步提升智能化水平。
許多企業(yè)在做“數(shù)字化”轉(zhuǎn)型,其實(shí)是需要知識管理與人工智能的加持,需要裝配上一個(gè)有思想的大腦。
引入知識管理與人工智能(AI+KM),實(shí)現(xiàn)企業(yè)的“數(shù)智化”轉(zhuǎn)型,可孕育出企業(yè)的“超級智慧大腦”。
當(dāng)然,ChatGPT及其同類產(chǎn)品,在企業(yè)落地時(shí),也將面臨諸多的巨大挑戰(zhàn),如生產(chǎn)的內(nèi)容是否可信、私域的數(shù)據(jù)是否安全、落地的成本是否可控等。
這時(shí)候,企業(yè)的知識管理推動者,必須找到靠譜的服務(wù)廠商以及可以適用于企業(yè)場景的生成式AI產(chǎn)品。
3.3? 回歸人的本質(zhì),充分發(fā)掘人的創(chuàng)造性及潛力
我們經(jīng)常會說“人工智能”,“人工”一詞排在前面,“智能”一詞排在后面。因此,先是人工,后再智能。
許多人在測試時(shí)會發(fā)現(xiàn),ChatGPT經(jīng)常會一本正經(jīng)地胡說八道。它本質(zhì)上只是通過概率最大化不斷生成數(shù)據(jù)而已,而不是通過邏輯推理來生成回復(fù)。
知名作家余華說ChatGPT“寫得很完美,但其實(shí)很平庸。不會對我和王安憶構(gòu)成什么威脅”。
無論ChatGPT再如何牛,它目前還是無法獨(dú)自創(chuàng)造出新的知識,與靈性充盈的人類大腦還是有本質(zhì)的區(qū)別。
我們古圣先賢,對于宇宙和人生的真相一直在孜孜不倦地上下求索。西方的文明善于向外探索,東方的文明則善于向內(nèi)追問。
中國儒家有著名的16字心傳“人心惟危,道心惟微;惟精惟一,允執(zhí)厥中”[9]。我們一直在“人心”與“道心”的平衡中追求“不二”之大道。
六祖惠能,目不識丁,于市賣柴之時(shí),聽聞客人誦《金剛經(jīng)》,心即開悟。之后五祖半夜三更密授衣法,明了“一切萬法,不離自性”[10],歷經(jīng)百死千難,開創(chuàng)了劃時(shí)代的禪宗頓教之東山法門。
這種不立文字、教外別傳、直指人心、見性成佛的上乘法門和美妙境界,又豈是當(dāng)前ChatGPT所能理解并學(xué)習(xí)的?
4? 結(jié)語
從IBM的“深藍(lán)”,到谷歌的AlphaGo,再到OpenAI的ChatGPT,AI的發(fā)展也都是積小成大,循序漸進(jìn),一步步實(shí)現(xiàn)突破的。
作為人類,我們不應(yīng)妄自尊大,無視技術(shù)的進(jìn)步和歷史滾滾的車輪。AI是一個(gè)可以孵化出無數(shù)工具、推動各行各業(yè)前進(jìn)的基礎(chǔ)平臺,對此我們必須要有足夠的重視和充分的準(zhǔn)備。
同時(shí),我們也不應(yīng)該妄自菲薄,面對AI的挑戰(zhàn)整日憂心忡忡。我們可能更需要選擇另外一個(gè)方向進(jìn)行突破,不斷開發(fā)內(nèi)在寶藏,喚醒本自具足的智慧,從而走向內(nèi)圣外王的光明之道。
參考文獻(xiàn):
[1] MEHDI Y. Announcing the next wave of AI innovation with Microsoft Bing and Edge[EB/OL]. [2023-05-04]. https://blogs.microsoft.com/blog/2023/05/04/announcing-the-next-wave-of-ai-innovation-with-microsoft-bing-and-edge/?form=MA13FJ.
[2] 吳雨欣. 百度正式發(fā)布文心一言,李彥宏現(xiàn)場Demo演示“五大能力”[EB/OL]. [2023-03-16]. https://www.thepaper.cn/newsDetail_forward_22322022. (WU Y X. Baidu officially launches ERNIE Bot, Robin Li demonstrates “Five Abilities”[EB/OL]. [2023-03-16]. https://www.thepaper.cn/newsDetail_forward_22322022.)
[3] 搜狐網(wǎng). 360GPT大模型產(chǎn)品矩陣“360智腦”將面向企業(yè)用戶開放內(nèi)測[EB/OL]. [2023-04-09]. https://it.sohu.com/a/665706470_121687421. (SOHU. 360GPT large model product matrix “360 Wisdom Brain” will be open to private testing for enterprise users[EB/OL]. [2023-04-09]. https://it.sohu.com/a/665706470_121687421.)
[4] 和訊網(wǎng). 阿里大模型交卷!宣布開放通義千問,未來所有產(chǎn)品都將接入升級改造[EB/OL]. [2023-04-11]. https://baijiahao.baidu.com/s?id=1762863793414188877&wfr=spider&for=pc. (HEXUN. Ali big model hand in the paper! It announced the opening of Tongyi Qianwen and all products will be upgraded in the future[EB/OL]. [2023-04-11]. https://baijiahao.baidu.com/s?id=1762863793414188877&wfr=spider&for=pc.)
[5] 新浪網(wǎng). 金山辦公發(fā)布WPS AI[EB/OL]. [2023-04-18]. http://k.sina.com.cn/article_6365990425_m17b714e19033011qhq.html. (SINA. Kingsoft office launched the WPS AI [EB/OL]. [2023-04-18]. http://k.sina.com.cn/article_6365990425_m17b714e19033011qhq.html.)
[6] OpenAI. Aligning language models to follow instructions[EB/OL]. [2022-01-27]. https://openai.com/research/instruction-following.
[7] 曾憲勇. AIGC啟“元”,百度展開“宏”圖[EB/OL]. [2023-01-12]. https://www.toutiao.com/article/7187668662726181408/. (ZENG X Y. AIGC kicks off, Baidu will accomplish much[EB/OL]. [2023-01-12]. https://www.toutiao.com/article/7187668662726181408/.)
[8] 每日經(jīng)濟(jì)新聞. ChatGPT為何能“打敗”眾多大模型,除了千億級參數(shù),還有什么[EB/OL]. [2023-02-20]. https://baijiahao.baidu.com/s?id=1758359676383295338&wfr=spider&for=pc. (National Business Daily. Why ChatGPT can “beat” so many large models? Other than because of the hundred-billion parameters, what else? [EB/OL]. [2023-02-20]. https://baijiahao.baidu.com/s?id=1758359676383295338&wfr=spider&for=pc.)
[9] 尚書[M]. 王世舜, 王翠葉, 注. 北京: 中國書局, 2012. (Shang Shu [M]. WANG S S, WANG C Y, Note. Beijing: China Book Company, 2012.)
[10] 壇經(jīng)[M]. 尚榮, 譯. 北京: 中國書局, 2018. (Altar Sutra [M]. SHANG R, Trans. Beijing: China Book Company, 2018.)
What Impact Will ChatGPT Have on the Knowledge Management?
Wu Qinghai
Pioneers Alliance Technology Co. Ltd., Beijing 100096
Abstract: [Purpose/Significance] Chat Generative Pre-trained Transformer (ChatGPT) has become popular, producing content through artificial intelligence and opening a new door for knowledge management in enterprises. [Method/Process] By studying the origin and development of ChatGPT, the relationship between it and knowledge management was sorted out, and its impact on knowledge managers was analyzed. [Result/Conclusion] ChatGPT and its similar products will promote significant changes in the knowledge management, and knowledge management practitioners should be proactive, plan ahead, and immerse themselves in it and embrace it.
Keywords: ChatGPT? ? knowledge management? ? artificial intelligence? ? AIGC? ? content generation