王建新
(南京圖書館,江蘇 南京 210018)
1956年,約翰·麥卡錫(John McCarthy)在達(dá)特茅斯會(huì)議上首次提出“人工智能”(Artificial Intelligence)的概念[1]。人工智能作為計(jì)算機(jī)科學(xué)的一個(gè)分支,被人們稱為“現(xiàn)代技術(shù)的三大尖端之一”。美國(guó)國(guó)際斯坦福研究所人工智能研究中心主任尼爾遜將人工智能描述為“有關(guān)認(rèn)知的課程”[2]。麻省理工學(xué)院的溫斯頓教授認(rèn)為,人工智能是研究如何利用計(jì)算機(jī)執(zhí)行過去只有人類才能完成的任務(wù)[3]。雖然學(xué)者們對(duì)人工智能的定義各不相同,但他們的觀點(diǎn)都體現(xiàn)了人工智能學(xué)科研究的基本思路與內(nèi)涵,將人工智能科學(xué)歸納為研究人類智慧活動(dòng)的基本規(guī)律。
人工智能時(shí)代,世界信息量快速增多,技術(shù)的進(jìn)步逐步改變了用戶的信息行為和信息需求,圖書館用戶流失的問題日益凸顯。2017年的調(diào)查數(shù)據(jù)顯示,我國(guó)網(wǎng)民人數(shù)超過7.5億人,其中移動(dòng)互聯(lián)網(wǎng)網(wǎng)民接近10億人[4],我國(guó)國(guó)民的閱讀量與微信讀書時(shí)長(zhǎng)持續(xù)增加。相關(guān)調(diào)查數(shù)據(jù)顯示,人們偏好利用搜索引擎檢索閱讀資源,圖書館網(wǎng)站的利用率較低,紙質(zhì)圖書借閱量呈下降趨勢(shì),用戶流失問題嚴(yán)重。
目前,信息服務(wù)領(lǐng)域的“信息孤島”問題仍然存在。雖然圖書館積極依托超星、CNKI、Elsevier、EBSCO等大型數(shù)據(jù)庫(kù)開展智慧化建設(shè),但由于各數(shù)據(jù)庫(kù)的資源操作模式、數(shù)據(jù)格式不同,圖書館在人工智能資源利用方面存在較多問題。EDS、Summon、Primo等國(guó)外的搜索引擎支持統(tǒng)一檢索,資料公開,但我國(guó)CNKI、超星、百度學(xué)術(shù)等數(shù)據(jù)庫(kù)的搜索引擎仍無法全面實(shí)現(xiàn)精準(zhǔn)檢索和知識(shí)聯(lián)系。美國(guó)圖書館協(xié)會(huì)的相關(guān)報(bào)告提出,2010年至2016年,學(xué)校圖書館的數(shù)字內(nèi)容檢索成功率有所提高,但用戶體驗(yàn)仍然不佳,說明學(xué)校圖書館在資源整合方面存在問題。
國(guó)外的Google、Bing、Yahoo,以及我國(guó)的百度、搜狗、360等搜索引擎大多以被動(dòng)式檢索為主,用戶需主動(dòng)輸入準(zhǔn)確的關(guān)鍵字才能完成檢索,僅能提供鏈接,缺少與用戶的互動(dòng)。目前,搜索引擎存在的主要問題為無法整合多維度的信息、難以處理詞語表達(dá)差異及難以實(shí)現(xiàn)個(gè)性化搜索等。為實(shí)現(xiàn)智能檢索,圖書館應(yīng)對(duì)大規(guī)模結(jié)構(gòu)化數(shù)據(jù)進(jìn)行快速檢索、整理,以感知網(wǎng)頁(yè)中的內(nèi)容及其含義,并將非結(jié)構(gòu)化的聲音、影像等信息轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別的數(shù)據(jù)。
圖書館大多為社會(huì)公益性組織,運(yùn)營(yíng)資金主要依賴財(cái)政撥款。在不明確人工智能技術(shù)經(jīng)濟(jì)效益的前提下,圖書館應(yīng)通過合資、自主開發(fā)或申請(qǐng)政府資助等方式解決技術(shù)資金問題,開展人工智能項(xiàng)目的研發(fā)工作。目前,僅有部分大型圖書館有機(jī)會(huì)獲得有關(guān)部門和機(jī)構(gòu)的科研資金支持,但仍難以滿足圖書館對(duì)人工智能技術(shù)的研究需求。因此,圖書館要想在人工智能領(lǐng)域?qū)崿F(xiàn)跨越式發(fā)展,就必須不斷尋找新的資金來源和合作途徑。
筆者構(gòu)建了一種基于人工智能技術(shù)的圖書館框架,該框架主要涵蓋基本硬件層、數(shù)據(jù)融合層、技術(shù)處理層、應(yīng)用服務(wù)層等主要層級(jí),綜合利用大數(shù)據(jù)分析、數(shù)據(jù)挖掘、圖像信息服務(wù)、機(jī)器學(xué)習(xí)、智能信息提取等人工智能技術(shù),實(shí)現(xiàn)多場(chǎng)景、多維度、多業(yè)務(wù)的圖書館智能服務(wù)規(guī)劃,以期為讀者提供智能圖書推薦、智能導(dǎo)航定位、智能參考咨詢、智能檢索及智能預(yù)約等智慧化服務(wù)。
3.2.1 基本硬件層?;居布雍w傳統(tǒng)的電腦控制系統(tǒng)、存儲(chǔ)器、計(jì)算設(shè)備等要件,以及互聯(lián)網(wǎng)、傳感器、信息處理等人工智能技術(shù)設(shè)施,可為智能圖書館平臺(tái)的大規(guī)模信息化建設(shè)提供軟硬件支持。
3.2.2 數(shù)據(jù)融合層。數(shù)據(jù)融合層一般分為資源信息池、讀者信息池和認(rèn)知信息池三個(gè)部分。其中,資源信息池是圖書館底層的數(shù)據(jù)資源,認(rèn)知信息池包括無線感應(yīng)、視頻監(jiān)測(cè)、基于RFID技術(shù)的空間信息等要素,讀者信息池包含讀者的個(gè)人信息和行為信息。數(shù)據(jù)融合層可提供互聯(lián)網(wǎng)信息、資料庫(kù)信息、組織架構(gòu)信息、開放存儲(chǔ)信息、網(wǎng)絡(luò)資源信息等基礎(chǔ)數(shù)據(jù),這些信息部分來源于圖書館的資源管理數(shù)據(jù)體系,部分來源于互聯(lián)網(wǎng)、知識(shí)庫(kù)等[5]。
3.2.3 技術(shù)處理層。技術(shù)處理層是該總體框架的核心層,集成了統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、自然語言處理等功能,能夠?qū)崟r(shí)對(duì)讀者的行為進(jìn)行感知研究,發(fā)掘業(yè)務(wù)需求[6]。技術(shù)處理層的關(guān)鍵技術(shù)包括統(tǒng)計(jì)分析與數(shù)據(jù)挖掘、聚類分析與預(yù)測(cè)、定量分析與定性分析等。
3.2.4 應(yīng)用服務(wù)層。應(yīng)用服務(wù)層為圖書館智能業(yè)務(wù)的最終表現(xiàn)形式,主要包括智能數(shù)據(jù)信息資源業(yè)務(wù)、智能信息內(nèi)容業(yè)務(wù)和智能信息需求業(yè)務(wù)三個(gè)部分,旨在準(zhǔn)確掌握讀者的智能業(yè)務(wù)需求,開展有針對(duì)性的智能服務(wù),協(xié)助讀者收集、使用及共享信息數(shù)據(jù)。
圖書館要想科學(xué)、合理、有效地利用人工智能技術(shù),就要提升館員和讀者的技術(shù)素養(yǎng),不斷拓寬人工智能技術(shù)的利用渠道,解決運(yùn)營(yíng)過程中存在的技術(shù)問題。為此,圖書館可引導(dǎo)館員深入學(xué)習(xí)人工智能技術(shù),利用人工智能技術(shù)解決工作中的實(shí)際問題,提升他們的服務(wù)工作質(zhì)量;加大對(duì)館員的培訓(xùn)力度,使館員完全掌握人工智能技術(shù)的利用方式,提升服務(wù)能力;開設(shè)以人工智能技術(shù)為主題的專業(yè)培養(yǎng)課程,并注重信息技術(shù)的創(chuàng)新性研究[7]。
大數(shù)據(jù)關(guān)乎所有公民的個(gè)人隱私安全,因此,圖書館必須建立規(guī)范的大數(shù)據(jù)應(yīng)用標(biāo)準(zhǔn),明確基于人工智能的數(shù)據(jù)分析及應(yīng)用權(quán)限,防止相關(guān)問題和糾紛的產(chǎn)生。一方面,有關(guān)部門應(yīng)在法治倫理層面規(guī)范和約束圖書館利用人工智能技術(shù)的行為;另一方面,圖書館應(yīng)根據(jù)相關(guān)法律法規(guī)建立智能圖書館數(shù)據(jù)使用標(biāo)準(zhǔn),科學(xué)、正確處理在利用人工智能技術(shù)過程中出現(xiàn)的各類問題,維護(hù)讀者和館員的正當(dāng)權(quán)益。