国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

傳統(tǒng)出版社知識(shí)服務(wù)轉(zhuǎn)型發(fā)展的實(shí)踐與展望

2017-08-17 22:09徐東
出版廣角 2017年14期
關(guān)鍵詞:圖譜檢索實(shí)體

徐東

【摘 要】互聯(lián)網(wǎng)的發(fā)展給用戶提供了方便的信息獲取途徑,便攜式終端設(shè)備性能提升、交互便捷,為用戶隨時(shí)隨地獲取大量信息提供了保障。但面對海量信息,如何找到知識(shí)內(nèi)化過程中所需要的信息,成為用戶面臨的最大問題。人工智能技術(shù)的發(fā)展為信息傳播領(lǐng)域的信息超載提供了新的技術(shù)解決方式,是出版企業(yè)開展知識(shí)服務(wù)的可行路徑。

【關(guān) 鍵 詞】出版;人工智能;嵌入式;知識(shí)服務(wù)

【作者單位】董良廣,人民衛(wèi)生出版社有限公司,人民衛(wèi)生電子音像出版社有限公司。

當(dāng)下,信息逐漸趨于泛在化,互聯(lián)網(wǎng)的發(fā)展給用戶提供了方便的信息獲取途徑,便攜式終端設(shè)備性能提升、交互便捷,為用戶隨時(shí)隨地獲取大量信息提供了保障?;诖耍瑥暮A啃畔?dāng)中提取對自身有益的相關(guān)知識(shí)成為當(dāng)務(wù)之急。以往,傳統(tǒng)出版企業(yè)必須借助物質(zhì)載體開展精神活動(dòng),比如通過書報(bào)等載體傳播信息,這是單純的信息資源傳遞模式,也是被動(dòng)型信息服務(wù)方式。但在當(dāng)今社會(huì),這種方式無法有效切入用戶知識(shí)應(yīng)用和創(chuàng)新的核心過程,因此,出版企業(yè)要轉(zhuǎn)變思路,變被動(dòng)為主動(dòng)。在個(gè)性化知識(shí)需求不斷增加的新形勢下,出版企業(yè)應(yīng)調(diào)整定位,利用人工智能等技術(shù),從浩瀚的信息資源中提取各種顯性和隱形的知識(shí),以對信息知識(shí)的生產(chǎn)組織、搜尋、分析、重組為基礎(chǔ),根據(jù)用戶需求策劃生產(chǎn)內(nèi)容,并將其融入用戶解決問題的過程和場景中,進(jìn)而提出能夠有效解決問題的方案,最終實(shí)現(xiàn)知識(shí)應(yīng)用和知識(shí)創(chuàng)新。由此可見,人工智能技術(shù)的發(fā)展為信息傳播領(lǐng)域的信息超載提供了新的技術(shù)解決方式,是出版企業(yè)開展知識(shí)服務(wù)的可行路徑[1]。

本文以人民衛(wèi)生出版社(以下簡稱人衛(wèi)社)為例,探索出版企業(yè)基于人工智能開展知識(shí)服務(wù)的可行路徑。對人衛(wèi)社而言,醫(yī)學(xué)領(lǐng)域知識(shí)復(fù)雜、更新迅速,單靠人力無法梳理各種知識(shí)之間的關(guān)聯(lián),因此,需要借助人工智能技術(shù),建立醫(yī)學(xué)知識(shí)圖譜,并將其嵌入用戶的工作流程中,提供即時(shí)知識(shí)服務(wù)。

一、出版企業(yè)開展知識(shí)服務(wù)的路徑

隨著大數(shù)據(jù)時(shí)代的來臨,一方面,醫(yī)學(xué)領(lǐng)域面臨大量分布式的、異構(gòu)的醫(yī)學(xué)數(shù)據(jù),醫(yī)學(xué)領(lǐng)域?qū)I(yè)分化越來越細(xì),這給醫(yī)學(xué)專業(yè)從業(yè)人員理解醫(yī)學(xué)知識(shí)造成困難;另一方面,醫(yī)學(xué)專業(yè)從業(yè)人員對于能體現(xiàn)自己個(gè)性、具有整合性和知識(shí)性的服務(wù)需求日益增多。因此,出版領(lǐng)域迫切需要做出改變,要結(jié)合各項(xiàng)人工智能技術(shù)研究成果,積極探索知識(shí)服務(wù)的轉(zhuǎn)變方向。作為我國醫(yī)藥領(lǐng)域出版規(guī)模最大、產(chǎn)品質(zhì)量高、綜合實(shí)力強(qiáng)的出版社,人衛(wèi)社擁有醫(yī)藥教材、學(xué)術(shù)專著、科普圖書、期刊、外文圖書、數(shù)字新媒體等出版資源,也擁有醫(yī)藥衛(wèi)生各專業(yè)領(lǐng)域的優(yōu)質(zhì)作者資源,能夠組織專家撰寫各方面的相關(guān)內(nèi)容,“人衛(wèi)”品牌已深入全國廣大醫(yī)藥院校師生、醫(yī)藥工作者心中,擁有龐大的行業(yè)用戶群。在這樣的背景和條件下,人衛(wèi)社從2008年起開始探索如何利用已有資源服務(wù)醫(yī)藥衛(wèi)生專業(yè)人員,從解決用戶在工作中可能面臨的問題入手,借助知識(shí)組織技術(shù)、語義技術(shù)和用戶行為分析技術(shù),通過建設(shè)人衛(wèi)臨床知識(shí)庫向用戶提供服務(wù)(見圖1)。

1. 轉(zhuǎn)變策劃觀念,以用戶需求為導(dǎo)向

知識(shí)服務(wù)是面向用戶需求的個(gè)性化服務(wù),出版企業(yè)要從用戶需求出發(fā),結(jié)合本單位實(shí)際情況,確立內(nèi)容資源建設(shè)目標(biāo)。即以用戶需求為導(dǎo)向,統(tǒng)一思路,明確重點(diǎn),厘清職責(zé),形成資源策劃、采集、加工、管理和出版發(fā)布一體化的資源建設(shè)業(yè)務(wù)流程,為不同產(chǎn)品的整合開發(fā)和面向不同用戶提供不同服務(wù)奠定基礎(chǔ)。對已有出版內(nèi)容加工的過程,也是細(xì)致梳理內(nèi)容資源分布、組織結(jié)構(gòu)的過程。在這個(gè)過程中,出版企業(yè)可以發(fā)現(xiàn)原有內(nèi)容在面向用戶提供知識(shí)服務(wù)時(shí)的優(yōu)勢和不足;針對內(nèi)容分布,可有針對性地進(jìn)行調(diào)整,彌補(bǔ)圖書出版和視聽教材出版中的不足之處,進(jìn)而形成合理全面的內(nèi)容分布。選題策劃是出版的基礎(chǔ),亦是效益的源頭,它是一項(xiàng)復(fù)雜的系統(tǒng)工程,始終貫穿知識(shí)傳播的全過程,不僅要求編輯提出策劃創(chuàng)意,還要求編輯根據(jù)用戶需求創(chuàng)新生產(chǎn)內(nèi)容,以滿足用戶體驗(yàn)和市場需要,實(shí)現(xiàn)線上線下互動(dòng)、虛擬現(xiàn)實(shí)結(jié)合、作者用戶(PGC-UGC)融合、創(chuàng)作眾創(chuàng)兼容[2]。

2.以醫(yī)學(xué)本體為例構(gòu)建基礎(chǔ)數(shù)據(jù)

醫(yī)學(xué)本體是一種描述醫(yī)學(xué)領(lǐng)域知識(shí)的專用本體,旨在對醫(yī)學(xué)的重要概念、屬性以及概念間的關(guān)系做出一種形式化的說明。在網(wǎng)絡(luò)信息資源管理中,醫(yī)學(xué)本體可起到語義導(dǎo)航、語義檢索、語義標(biāo)注及術(shù)語服務(wù)等重要作用。人衛(wèi)社醫(yī)學(xué)本體參考了醫(yī)學(xué)系統(tǒng)命名法——臨床術(shù)語(Snomed CT)的架構(gòu),融合了《中國分類主題詞表》醫(yī)學(xué)類、國際疾病傷害及死因分類標(biāo)準(zhǔn)第十版(ICD-10)、手術(shù)與操作分類代碼(ICD-9-CM-3)、《醫(yī)學(xué)主題詞表》(MeSH)、解剖學(xué)治療學(xué)及化學(xué)分類系統(tǒng)(ATC)等國內(nèi)外主題詞表、術(shù)語表而形成。

人衛(wèi)社醫(yī)學(xué)本體按術(shù)語類型一一展開,計(jì)劃分多期進(jìn)行。其中,醫(yī)學(xué)核心術(shù)語共13類,通用術(shù)語共9類。第一期是構(gòu)建疾病本體。如圖2所示,人衛(wèi)社通過考察疾病的通用信息,擬從部位、病因、病理、癥狀/體征、檢查、檢驗(yàn)、治療手段、藥物幾個(gè)維度以及上下位關(guān)系(IS A)構(gòu)建疾病本體。

圖2 疾病本體結(jié)構(gòu)圖

3. 構(gòu)建專業(yè)領(lǐng)域的知識(shí)圖譜

知識(shí)圖譜最早由Google提出,是一種結(jié)構(gòu)化的語義知識(shí)庫,其基本組成單位是“實(shí)體—關(guān)系—實(shí)體”三元組,以及“實(shí)體—屬性—屬性值”。每個(gè)實(shí)體(概念)可以用一個(gè)全局唯一確定的標(biāo)識(shí)符來標(biāo)識(shí),關(guān)系則用來連接兩個(gè)實(shí)體(概念),刻畫它們之間的關(guān)聯(lián),每個(gè)屬性值可用來刻畫實(shí)體的內(nèi)在特性。知識(shí)圖譜本質(zhì)上是一種語義網(wǎng)絡(luò),結(jié)點(diǎn)代表實(shí)體(概念),邊代表實(shí)體(概念)之間的各種語義關(guān)系。實(shí)體(概念)之間通過語義關(guān)系相互連接,構(gòu)成網(wǎng)狀的知識(shí)結(jié)構(gòu)。知識(shí)圖譜構(gòu)建的過程可分為知識(shí)抽取、知識(shí)對齊和知識(shí)推理。知識(shí)抽取包括實(shí)體的提取和關(guān)系/屬性的提取。知識(shí)對齊包括實(shí)體對齊和關(guān)系/屬性對齊。實(shí)體對齊也稱為實(shí)體匹配(entity matching)或?qū)嶓w解析(entity resolution),旨在發(fā)現(xiàn)表達(dá)不同但卻代表醫(yī)學(xué)領(lǐng)域同一對象的實(shí)體,并將這些實(shí)體歸納為一個(gè)具有唯一標(biāo)識(shí)的實(shí)體對象。關(guān)系/屬性對齊與實(shí)體對齊類似,通過這個(gè)過程可形成高質(zhì)量的知識(shí)。知識(shí)推理用于發(fā)現(xiàn)隱含知識(shí),一般通過可擴(kuò)展的規(guī)則引擎來完成。此外,知識(shí)推理還可以豐富知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)。

人衛(wèi)社醫(yī)學(xué)知識(shí)圖譜數(shù)據(jù)主要源于人衛(wèi)臨床知識(shí)庫資源,結(jié)構(gòu)分為數(shù)據(jù)層和模式層兩層。數(shù)據(jù)層存儲(chǔ)的主要是從文本中提取的“實(shí)體—關(guān)系—實(shí)體”,或“實(shí)體—屬性—屬性值”,例如流行性感冒—臨床表現(xiàn)—發(fā)熱、紅細(xì)胞—正常值—(4--5.5)X1012/L。模式層主要存儲(chǔ)規(guī)則、條件、公理和醫(yī)學(xué)本體,用于對數(shù)據(jù)層的管理。構(gòu)建流程既遵循構(gòu)建過程的一般規(guī)律,又結(jié)合醫(yī)學(xué)資源和人衛(wèi)社資源的特點(diǎn)進(jìn)行。鑒于實(shí)體和關(guān)系/屬性的提取難度大、準(zhǔn)確性難以保證,以及實(shí)體之間較明確的關(guān)系,人衛(wèi)社將三元組提取的過程簡化,將實(shí)體的屬性統(tǒng)一為關(guān)系,僅提取實(shí)體(概念),根據(jù)預(yù)先設(shè)定的關(guān)系類型標(biāo)注提取的實(shí)體(概念)之間可能存在的關(guān)系,并且暫不進(jìn)行知識(shí)推理,留待知識(shí)圖譜完善后再進(jìn)行。其總體流程為:數(shù)據(jù)預(yù)處理→實(shí)體種類確定、關(guān)系/屬性定義→實(shí)體(概念)抽取→實(shí)體(概念)標(biāo)準(zhǔn)化→三元組審核知識(shí)圖譜形成。

4. 獲取用戶數(shù)據(jù),構(gòu)建個(gè)性化知識(shí)圖譜

用戶需求分析包括4個(gè)方面:靜態(tài)屬性分析、動(dòng)態(tài)屬性分析、用戶消費(fèi)屬性分析和用戶心理屬性分析。靜態(tài)屬性指的是用戶在網(wǎng)頁上填寫的基本信息。可獲取的用戶個(gè)人信息有以下幾項(xiàng):用戶名、真實(shí)姓名、性別、出生年月、手機(jī)號(hào)、所在院校、從事專業(yè)等。動(dòng)態(tài)屬性指的是用戶使用互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)信息。比如想了解用戶的醫(yī)學(xué)知識(shí)偏好和學(xué)習(xí)手段,可獲取的信息有用戶的檢索歷史、收藏記錄、點(diǎn)擊記錄、瀏覽記錄和時(shí)長、下載記錄、閱讀筆記等。用戶消費(fèi)屬性指的是用戶的消費(fèi)水平、消費(fèi)心理、消費(fèi)嗜好等。可獲取的信息有用戶購買的圖書名稱、圖書的價(jià)格等。用戶心理屬性指的是用戶的生活、工作、情感狀態(tài)、社交等。可獲取的信息有用戶上網(wǎng)時(shí)間、關(guān)注人群、交友圈等。比如依據(jù)用戶靜態(tài)屬性分析,可先將人衛(wèi)社用戶分為專業(yè)用戶和大眾用戶兩大類,其中主要為專業(yè)用戶;專業(yè)用戶又可再細(xì)分為醫(yī)學(xué)生、教師、醫(yī)務(wù)人員(醫(yī)師、護(hù)士、藥師)、科研人員等類別。通過逐級向下劃分的方式,便可形成用戶分類樹形結(jié)構(gòu),這可為針對某類用戶的共同需求研發(fā)產(chǎn)品提供參考。此外,還可將用戶性別、年齡等靜態(tài)屬性與用戶其他屬性結(jié)合,進(jìn)行統(tǒng)計(jì)分析,形成用戶群的多種分類。

人衛(wèi)社通過實(shí)踐證明,綜合分析用戶屬性,形成用戶多維度需求情況分析結(jié)果,在用戶查詢理解信息、檢索結(jié)果排序和知識(shí)推送方面可起到有效的優(yōu)化作用。

5. 嵌入式的知識(shí)服務(wù)模式——以醫(yī)學(xué)領(lǐng)域用戶為例

醫(yī)學(xué)是一門覆蓋面廣、內(nèi)容精深復(fù)雜的自然科學(xué)。隨著研究的不斷深入,醫(yī)學(xué)專業(yè)分科越來越細(xì),研究和利用醫(yī)學(xué)的臨床醫(yī)生或者醫(yī)學(xué)科研工作者不僅渴求信息,更渴求專業(yè)的知識(shí)內(nèi)容。臨床醫(yī)生沒有大量的時(shí)間和精力獲取知識(shí),一旦脫離工作環(huán)境,學(xué)習(xí)目標(biāo)將不明確,效率比較低。因此,這個(gè)領(lǐng)域迫切需要建立一種嵌入式的知識(shí)服務(wù)模式,這種模式可幫助臨床醫(yī)生在繁忙的臨床工作或科研活動(dòng)中補(bǔ)充知識(shí),及時(shí)解決遇到的問題,且不需要專門花費(fèi)大量的時(shí)間和精力去學(xué)習(xí)。

圖3 臨床診療過程中嵌入知識(shí)服務(wù)流程圖

臨床診療極其復(fù)雜,它不是一個(gè)簡單的線性處理過程。圖3是在臨床診療過程中嵌入知識(shí)服務(wù)的基本流程,簡單展示在不同環(huán)節(jié)可能實(shí)現(xiàn)的知識(shí)服務(wù)。知識(shí)服務(wù)是循環(huán)迭代知識(shí)獲取、知識(shí)吸收、知識(shí)創(chuàng)新、知識(shí)應(yīng)用這幾個(gè)環(huán)節(jié),不斷調(diào)整和優(yōu)化知識(shí)服務(wù)產(chǎn)品和解決方案的過程。在臨床診療過程中嵌入知識(shí)服務(wù)是一種主動(dòng)的、與用戶交互的服務(wù)方式,它可以隨著用戶需求的變化調(diào)整服務(wù)方式、服務(wù)地點(diǎn)以及服務(wù)內(nèi)容。

人衛(wèi)社針對臨床診療提供嵌入式知識(shí)服務(wù),建立了疾病知識(shí)庫、病例數(shù)據(jù)庫、臨床診療路徑數(shù)據(jù)庫、診療指南知識(shí)庫和臨床用藥參考知識(shí)庫。這些數(shù)據(jù)庫的知識(shí)內(nèi)容組織與臨床診療體系一致,如采用ICD-10和ICD-9-CM-3組織內(nèi)容、提供服務(wù),具體的服務(wù)方式是將知識(shí)服務(wù)部署到醫(yī)院內(nèi)部服務(wù)器,門診病房的計(jì)算機(jī)通過醫(yī)院局域網(wǎng)可以隨時(shí)訪問知識(shí)庫,醫(yī)務(wù)人員還可以通過手機(jī)應(yīng)用連接局域網(wǎng)知識(shí)庫。后續(xù)人衛(wèi)社會(huì)將知識(shí)庫與醫(yī)院信息系統(tǒng)進(jìn)行整合,屆時(shí)可實(shí)時(shí)獲取醫(yī)生輸入的病患信息,對信息進(jìn)行分析,結(jié)合人工智能技術(shù),可充分了解醫(yī)生所面對病患的個(gè)體情況,進(jìn)而可結(jié)合知識(shí)圖譜提供與之相關(guān)的知識(shí)內(nèi)容。除了輔助臨床診療,嵌入式知識(shí)服務(wù)還可以跟蹤臨床醫(yī)生在診療過程中尋求知識(shí)的行為,通過采集積累,了解臨床醫(yī)生關(guān)注的知識(shí)內(nèi)容范圍和其研究的發(fā)展方向,形成個(gè)性化知識(shí)圖譜,并與整體知識(shí)圖譜映射,提供精準(zhǔn)的知識(shí)服務(wù)。

6.知識(shí)服務(wù)平臺(tái)的研發(fā)思路——以人衛(wèi)臨床知識(shí)庫為例

內(nèi)容是知識(shí)服務(wù)的基礎(chǔ),技術(shù)是知識(shí)服務(wù)的重要支撐和保障。平臺(tái)面向用戶交互,通過本體管理內(nèi)容,以大數(shù)據(jù)技術(shù)分析用戶需求,是為用戶提供嵌入式、個(gè)性化知識(shí)服務(wù)的場所和環(huán)境。

人衛(wèi)臨床知識(shí)庫是在醫(yī)學(xué)生有學(xué)習(xí)知識(shí)需求、臨床醫(yī)生有診療輔助需求的驅(qū)動(dòng)下,以資源的組織與整合為基礎(chǔ),構(gòu)建的包括疾病知識(shí)庫、病例數(shù)據(jù)庫、臨床診療路徑數(shù)據(jù)庫、診療指南知識(shí)庫、臨床用藥參考知識(shí)庫、影像圖片數(shù)據(jù)庫和視頻數(shù)據(jù)庫等在內(nèi)的具有中西醫(yī)特色的知識(shí)服務(wù)平臺(tái)。從功能模塊的角度來看,這個(gè)平臺(tái)的應(yīng)用主要包括基于本體和知識(shí)圖譜的資源加工系統(tǒng)、基于語義的全文檢索系統(tǒng)、基于共現(xiàn)分析的知識(shí)關(guān)聯(lián)系統(tǒng)和基于用戶信息的個(gè)性化服務(wù)系統(tǒng)。人衛(wèi)臨床知識(shí)庫借助系統(tǒng)提供的各種資源分析及檢索工具,為用戶提供信息瀏覽、相關(guān)文獻(xiàn)推薦、知識(shí)地圖等各種知識(shí)服務(wù)。

(1)基于本體和知識(shí)圖譜的資源加工系統(tǒng)

人衛(wèi)社資源標(biāo)引以本體和知識(shí)圖譜為標(biāo)準(zhǔn),從整體和局部分層次進(jìn)行。標(biāo)引圖書時(shí)將標(biāo)引層次分為圖書整體、篇章、節(jié)、小節(jié)、段落幾個(gè)層面,標(biāo)引結(jié)果區(qū)分主次。如“抗高血壓藥的合理應(yīng)用”,核心主題為“抗高血壓藥、合理應(yīng)用”,次要主題為“高血壓……”,可根據(jù)數(shù)據(jù)特征、用戶關(guān)注點(diǎn)標(biāo)引多個(gè)字段內(nèi)容。關(guān)于疾病的內(nèi)容,除標(biāo)引疾病外,還應(yīng)標(biāo)出疾病的易感人群、所屬臨床科室等。至于檢驗(yàn)的內(nèi)容,則應(yīng)標(biāo)引標(biāo)本名稱。

(2)基于語義的全文檢索系統(tǒng)

檢索系統(tǒng)的主要功能是對平臺(tái)中其他系統(tǒng)提供的資源進(jìn)行索引,為用戶提供統(tǒng)一的檢索服務(wù),同時(shí)以多種形式呈現(xiàn)檢索結(jié)果,滿足用戶的個(gè)性化需求。平臺(tái)建設(shè)之初,沒有針對醫(yī)學(xué)內(nèi)容的搜索引擎,我們基于開源的Lucene項(xiàng)目,對醫(yī)學(xué)分詞進(jìn)行優(yōu)化,將詞典分詞和算法分詞結(jié)合,開發(fā)醫(yī)學(xué)新詞發(fā)現(xiàn)系統(tǒng),不斷補(bǔ)充醫(yī)學(xué)專業(yè)分詞。平臺(tái)的全文檢索系統(tǒng)具有多種檢索功能,包括基本檢索、高級檢索、分類檢索、二次檢索、精確檢索、擴(kuò)展檢索、語義檢索等。檢索系統(tǒng)組件提供的服務(wù)則主要包括輸入檢索詞提示、熱點(diǎn)關(guān)鍵詞提示、檢索結(jié)果聚合、檢索結(jié)果篩選、日志分析組件等。

(3)基于共現(xiàn)分析的知識(shí)關(guān)聯(lián)系統(tǒng)

共現(xiàn)分析是將各種信息載體中的共現(xiàn)信息定量化的分析方法,以揭示信息的內(nèi)容關(guān)聯(lián)和特征項(xiàng)所隱含的寓意。在計(jì)算機(jī)技術(shù)的輔助下,共現(xiàn)分析以其方法的簡明性和分析結(jié)果的可靠性,成為支撐信息內(nèi)容分析的重要手段和工具。面對海量的信息資源,如何從宏觀層面上分析知識(shí)內(nèi)容之間的關(guān)聯(lián),把握信息資源的核心主題,為用戶提供一個(gè)快速進(jìn)入研究領(lǐng)域的知識(shí)入口,對知識(shí)服務(wù)而言有重要的意義。我們在構(gòu)建醫(yī)學(xué)詞表、醫(yī)學(xué)本體和知識(shí)圖譜的基礎(chǔ)上,對標(biāo)引分類的結(jié)構(gòu)化內(nèi)容進(jìn)行共現(xiàn)分析,建立醫(yī)學(xué)概念之間的關(guān)聯(lián)關(guān)系,一方面有助于知識(shí)圖譜的動(dòng)態(tài)更新,另一方面可以發(fā)現(xiàn)新知識(shí)。舉例來說,A表示一種物質(zhì)的攝入可能導(dǎo)致某生理改變B,而B的生理變化又引發(fā)某一器官的疾病C,D藥物是治療疾病C的非針對性藥物,這樣,可獲得A作用于C和D并影響B(tài)的有用信息。這種隱含聯(lián)系在單獨(dú)一篇文獻(xiàn)中是發(fā)現(xiàn)不了的,但通過關(guān)聯(lián)關(guān)系的梳理,我們能夠把這種隱含聯(lián)系挖掘出來。

(4)基于用戶信息的個(gè)性化服務(wù)系統(tǒng)

知識(shí)服務(wù)是面向個(gè)人問題提供解決方案的服務(wù)模式,需要通過多種方式獲取用戶信息,實(shí)現(xiàn)用戶“畫像”。只有充分理解用戶需求,才能提供精準(zhǔn)的知識(shí)服務(wù)。知識(shí)服務(wù)的作用在于,進(jìn)行檢索時(shí),可通過語義分析,發(fā)掘檢索的核心需求,與醫(yī)學(xué)知識(shí)圖譜映射,查找和推薦相關(guān)內(nèi)容。我們在用戶注冊和使用平臺(tái)時(shí),會(huì)建議用戶填寫從事的專業(yè)和感興趣的相關(guān)專業(yè),并在用戶檢索和瀏覽內(nèi)容時(shí),根據(jù)學(xué)科及疾病分類體系,細(xì)化用戶專注的領(lǐng)域,根據(jù)用戶專注領(lǐng)域的不同,對內(nèi)容進(jìn)行加權(quán)調(diào)整。此外,用戶在平臺(tái)上發(fā)表的內(nèi)容也是獲取用戶信息的重要來源,我們可通過用戶與用戶的互動(dòng)發(fā)現(xiàn)、采集重要信息。

二、出版企業(yè)開展知識(shí)服務(wù)面臨的問題與思考

1. 編輯和出版企業(yè)應(yīng)轉(zhuǎn)變思路

隨著信息技術(shù)的快速發(fā)展,在現(xiàn)代出版企業(yè)中,編輯可利用技術(shù)手段進(jìn)行知識(shí)的二次生產(chǎn)。知識(shí)的二次生產(chǎn)是基于用戶明確需求開展的,不一定要按照圖書的出版規(guī)模來策劃,它可能是一個(gè)具體問題的解決方法,也可能是某一個(gè)操作視頻,這樣的內(nèi)容無法達(dá)到圖書出版要求,但在知識(shí)服務(wù)方面具有重要意義。作為編輯,要善于從用戶的行為中發(fā)現(xiàn)內(nèi)容短板,及時(shí)找到專業(yè)人員彌補(bǔ)短板;作為出版企業(yè),要圍繞某一領(lǐng)域的知識(shí)服務(wù)建立相應(yīng)的內(nèi)容生產(chǎn)出版流程和機(jī)制。

2. 基礎(chǔ)數(shù)據(jù)建設(shè)投入過大,應(yīng)靈活變通

詞表、分類體系、本體和知識(shí)圖譜等基礎(chǔ)數(shù)據(jù)建設(shè)是一項(xiàng)非常大的工程,也是實(shí)現(xiàn)知識(shí)服務(wù)的基礎(chǔ)條件。如果沒有成熟的資源可以運(yùn)用,出版企業(yè)自建平臺(tái)是很難實(shí)現(xiàn)的。以MeSH詞表為例,美國國立醫(yī)學(xué)圖書館歷時(shí)50余年,投入大量人力、財(cái)力,收集的主題詞不到3萬個(gè),這是因?yàn)楦拍畹姆秶?、概念與概念之間的關(guān)系、概念分類等是需要逐項(xiàng)界定的。因此,筆者建議出版企業(yè)最好采用現(xiàn)有的基礎(chǔ)數(shù)據(jù),并根據(jù)自己的項(xiàng)目需求進(jìn)行數(shù)據(jù)優(yōu)化。

3.平臺(tái)建設(shè)中的難點(diǎn)突破依賴技術(shù)進(jìn)步

知識(shí)服務(wù)是數(shù)字出版中的一種業(yè)務(wù)模式,技術(shù)與內(nèi)容的關(guān)系是涉及數(shù)字出版本質(zhì)的對應(yīng)關(guān)系?!皵?shù)字”是限定出版范圍、方式和手段的關(guān)鍵詞,它包含了數(shù)字技術(shù)、信息技術(shù)、互聯(lián)網(wǎng)技術(shù)、數(shù)據(jù)處理技術(shù)以及平臺(tái)開發(fā)技術(shù),是實(shí)現(xiàn)新型出版的核心。不能理解和掌握相應(yīng)的技術(shù),也就無法開展相應(yīng)的工作,無法開發(fā)產(chǎn)品和建設(shè)平臺(tái)。對于技術(shù),出版企業(yè)應(yīng)注重的不是技術(shù)研究而是對技術(shù)的靈活運(yùn)用,要理解相應(yīng)技術(shù)的特點(diǎn)、基本原理和實(shí)現(xiàn)邏輯,結(jié)合內(nèi)容和需求合理應(yīng)用現(xiàn)有的成熟技術(shù)。這需要出版企業(yè)針對內(nèi)容領(lǐng)域、出版領(lǐng)域和技術(shù)領(lǐng)域,培養(yǎng)和建立跨學(xué)科的復(fù)合型人才隊(duì)伍。目前開發(fā)的人工智能還處于“感知智能”階段,想提升至能主動(dòng)理解知識(shí)、判斷問題、提供解決方案的“認(rèn)知智能”階段還有很長的路要走。因此,出版企業(yè)運(yùn)用人工智能技術(shù)仍依賴技術(shù)的進(jìn)步。

4. 用戶行為獲取的準(zhǔn)確性與用戶服務(wù)

用戶需求挖掘是指以用戶的需求為目標(biāo),通過分析海量的數(shù)據(jù)找到用戶的顯性需求和隱性需求的過程。獲取用戶信息涉及用戶體驗(yàn)和法律問題,獲取準(zhǔn)確的用戶需求要在用戶場景中進(jìn)行,而要在收集到的信息中挖掘用戶的真實(shí)需求和隱性需求難度不小。用戶的知識(shí)背景、興趣、情感等會(huì)隨著時(shí)間遷移產(chǎn)生動(dòng)態(tài)變化,這影響了系統(tǒng)對用戶需求的判斷和用戶對知識(shí)服務(wù)的體驗(yàn)。因此,及時(shí)有效地捕獲用戶知識(shí)背景、興趣等方面的細(xì)微變化,對提升用戶體驗(yàn)而言至關(guān)重要,這有賴于人工智能技術(shù)的發(fā)展。

|參考文獻(xiàn)|

[1]張曉林. 重新認(rèn)識(shí)知識(shí)過程和知識(shí)服務(wù)[J]. 圖書情報(bào)工作,2009(1):6-8.

[2]杜賢. “互聯(lián)網(wǎng)+”時(shí)代的選題策劃[J]. 科技與出版,2017(2):47-50.

猜你喜歡
圖譜檢索實(shí)體
繪一張成長圖譜
前海自貿(mào)區(qū):金融服務(wù)實(shí)體
2019年第4-6期便捷檢索目錄
實(shí)體的可感部分與實(shí)體——兼論亞里士多德分析實(shí)體的兩種模式
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
兩會(huì)進(jìn)行時(shí):緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
專利檢索中“語義”的表現(xiàn)
雜草圖譜
國際標(biāo)準(zhǔn)檢索