国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向大數(shù)據(jù)的圖書館單元信息知識(shí)服務(wù)系統(tǒng)研究

2017-11-09 20:50:03張娟王向輝付然孫曉琳
現(xiàn)代情報(bào) 2017年10期
關(guān)鍵詞:大數(shù)據(jù)

張娟 王向輝 付然 孫曉琳

〔摘要〕[目的]為了實(shí)現(xiàn)海量數(shù)據(jù)中信息的知識(shí)組織,促進(jìn)單元信息和文獻(xiàn)信息內(nèi)容的知識(shí)關(guān)聯(lián)和知識(shí)發(fā)現(xiàn),構(gòu)建單元信息知識(shí)組織體系;[方法]以養(yǎng)生領(lǐng)域內(nèi)的領(lǐng)域本體、文獻(xiàn)信息等知識(shí)資源為基礎(chǔ),構(gòu)建養(yǎng)生單元信息知識(shí)服務(wù)系統(tǒng);[結(jié)果結(jié)論]“養(yǎng)生單元信息知識(shí)服務(wù)系統(tǒng)”(以下簡(jiǎn)稱“養(yǎng)生知識(shí)服務(wù)平臺(tái)”)是單元信息知識(shí)組織體系建設(shè)的重要應(yīng)用示范,提供語(yǔ)義檢索、知識(shí)瀏覽、知識(shí)推理和知識(shí)發(fā)現(xiàn)等服務(wù),實(shí)現(xiàn)大數(shù)據(jù)環(huán)境下“單元信息知識(shí)組織體系”的有效利用;[局限]文獻(xiàn)資源的單元信息抽取及分析涉及人工智能、計(jì)算機(jī)處理等相關(guān)技術(shù),技術(shù)實(shí)現(xiàn)有較大難度。

〔關(guān)鍵詞〕大數(shù)據(jù);單元信息;養(yǎng)生知識(shí);知識(shí)關(guān)聯(lián);知識(shí)發(fā)現(xiàn)

DOI:10.3969j.issn.1008-0821.2017.10.008

〔中圖分類號(hào)〕G252〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2017)10-0049-04

〔Abstract〕[Objective]In order to realize the knowledge organization of the mass data,and to promote the knowledge and knowledge discovery of the unit information and the content of the document information,it is necessary to construct the knowledge organization system;[method]Using the domain ontology and documents and other library knowledge resources in the field of health as the foundation,constructed the Health unit information knowledge service system;[Conclusion results]“Health unit information knowledge service system” (hereinafter referred to as the“health knowledge service platform”)was an important application of unit information Knowledge organization system,to provide semantic retrieval,knowledge browsing,knowledge inference and knowledge discovery service,and promote the effective use of the“unit information knowledge organization system”in the big data environment.[limited]The unit information extraction and analysis of the literature resources involved artificial intelligence,computer processing and other related technologies,to achieve greater difficulty.

〔Key words〕big data;unit information;health knowledge;knowledge association;knowledge discovery

大數(shù)據(jù)環(huán)境下,隨著文獻(xiàn)信息資源的快速增長(zhǎng),圖書館傳統(tǒng)的文獻(xiàn)組織方式已經(jīng)不能滿足用戶的知識(shí)性需求,面對(duì)大量信息資源應(yīng)該進(jìn)行組織加工方法的變革與創(chuàng)新,從對(duì)文獻(xiàn)為單元的組織加工轉(zhuǎn)變?yōu)閷?duì)單元信息的組織加工[1],借助計(jì)算機(jī)自動(dòng)技術(shù)進(jìn)行單元信息進(jìn)行挖掘與組織。針對(duì)大數(shù)據(jù)背景下用戶對(duì)知識(shí)信息的深層分析與潛在知識(shí)提取需求,信息服務(wù)工作必須進(jìn)行數(shù)字資源的智能化收集組織、分析挖掘、整合處理。精準(zhǔn)化的知識(shí)信息服務(wù)工作,需要通過(guò)對(duì)用戶的信息需求分析,對(duì)專業(yè)領(lǐng)域的知識(shí)數(shù)據(jù)進(jìn)行有效挖掘和分析,建立專題庫(kù),并充分利用大數(shù)據(jù)的分析和匯總,開發(fā)針對(duì)性的服務(wù)內(nèi)容,提供精細(xì)化、個(gè)性化內(nèi)容增值服務(wù)。本文選取了“養(yǎng)生知識(shí)”作為主題的資源庫(kù)建設(shè),討論如何整合關(guān)聯(lián)數(shù)據(jù)和資源,通過(guò)挖掘和組織、評(píng)價(jià),將傳統(tǒng)數(shù)據(jù)資源整合成一個(gè)全面、開放式的關(guān)聯(lián)知識(shí)網(wǎng)絡(luò),以滿足用戶和社會(huì)各界的需求。

1單元信息知識(shí)服務(wù)系統(tǒng)建設(shè)總體思路

單元信息知識(shí)服務(wù)系統(tǒng)是基于 “面向大數(shù)據(jù)的單元信息組織體系研究”的理論應(yīng)用而研發(fā)的系統(tǒng)平臺(tái),主要目的是實(shí)現(xiàn)圖書館館藏文獻(xiàn)單元信息的知識(shí)服務(wù)?!梆B(yǎng)生知識(shí)服務(wù)平臺(tái)”以養(yǎng)生知識(shí)領(lǐng)域的文獻(xiàn)單元信息為知識(shí)組織基元,以單元信息鏈接為樞紐來(lái)構(gòu)建知識(shí)組織的系統(tǒng),其組織過(guò)程一般經(jīng)歷文獻(xiàn)信息的單元信息抽取與標(biāo)注 、養(yǎng)生文獻(xiàn)庫(kù)、單元信息庫(kù)、養(yǎng)生知識(shí)庫(kù)的構(gòu)建。平臺(tái)不僅針對(duì)領(lǐng)域內(nèi)圖書館的后臺(tái)構(gòu)建和前臺(tái)呈現(xiàn),同時(shí)也在前臺(tái)向用戶開放,與用戶一起實(shí)現(xiàn)知識(shí)組織、構(gòu)建,系統(tǒng)整體構(gòu)架如圖1所示。

文獻(xiàn)庫(kù)由養(yǎng)生領(lǐng)域內(nèi)的圖書、報(bào)紙、期刊等文獻(xiàn)構(gòu)成,對(duì)這些文獻(xiàn)進(jìn)行單元信息的標(biāo)注,通過(guò)面向機(jī)構(gòu)的后臺(tái)及面向用戶的前臺(tái)提供單元信息的組織、加工功能,進(jìn)行單元信息的知識(shí)組織與管理。這是對(duì)圖書館以文獻(xiàn)整體為單元的組織加工體系進(jìn)行創(chuàng)新,在揭示文獻(xiàn)外形特征和整體內(nèi)容的基礎(chǔ)上,探索文獻(xiàn)信息資源的深度加工和利用方法,深入到文獻(xiàn)內(nèi)部,揭示文獻(xiàn)中所含的知識(shí)信息單元,并實(shí)現(xiàn)知識(shí)之間、文獻(xiàn)之間的關(guān)聯(lián)。實(shí)現(xiàn)圖書館信息加工實(shí)踐創(chuàng)新,選擇主題進(jìn)行單元信息知識(shí)組織,形成單元信息知識(shí)庫(kù),使隱性信息顯性化,使知識(shí)得到有效利用。endprint

單元信息知識(shí)庫(kù)的建設(shè)主要包括:①主題資源分析:結(jié)合資源特色及用戶需求,確定特定資源為主題進(jìn)行單元信息知識(shí)庫(kù)建設(shè)。②單元信息抽取:結(jié)合資源類型設(shè)計(jì)出各種文獻(xiàn)類型的單元信息抽取方法。資源類型包括圖書、期刊、報(bào)紙3種資源形式。③建立單元信息知識(shí)庫(kù),針對(duì)各類文獻(xiàn)的單元信息選擇合適的資源組織方法,如基于主題圖和元數(shù)據(jù)的資源組織。

2系統(tǒng)關(guān)鍵技術(shù)

信息組織和知識(shí)組織涉及到一些最新的理論和技術(shù),如本體、語(yǔ)義網(wǎng)、主題圖等技術(shù)方法,其應(yīng)用實(shí)踐主要依靠人工智能、計(jì)算機(jī)處理等技術(shù)的實(shí)現(xiàn),從實(shí)踐上來(lái)說(shuō)具有一定的挑戰(zhàn)。文獻(xiàn)資源的單元信息分析及抽取有較大難度,如某一專題的文獻(xiàn)資源包含多種類型,針對(duì)該領(lǐng)域的資源收集和單元信息的定義需要領(lǐng)域?qū)<业膮⑴c,各類文獻(xiàn)單元的抽取需要靠相關(guān)技術(shù)實(shí)現(xiàn)。

21本體知識(shí)庫(kù)構(gòu)建

本體知識(shí)庫(kù)是建立單元信息知識(shí)服務(wù)系統(tǒng)的基礎(chǔ)。所謂本體是共享概念模型的明確的形式化規(guī)范說(shuō)明 [2]。養(yǎng)生本體知識(shí)庫(kù)是存儲(chǔ)并管理與養(yǎng)生領(lǐng)域的相關(guān)概念,以及概念之間的相互關(guān)系,其目的是為養(yǎng)生知識(shí)的組織標(biāo)引提供支持。將本體引入知識(shí)表示,不僅可以用術(shù)語(yǔ)或概念對(duì)知識(shí)進(jìn)行表示,同時(shí)揭示這些知識(shí)之間存在的內(nèi)在關(guān)系。利用本體表示的知識(shí)通過(guò)類屬和語(yǔ)義進(jìn)行組織和關(guān)聯(lián),再利用這些知識(shí)進(jìn)行推理,從而能很好地滿足讀者學(xué)習(xí)的需要。本系統(tǒng)平臺(tái)的本體來(lái)源于用Protégé軟件已經(jīng)建立的數(shù)據(jù)導(dǎo)入到本知識(shí)庫(kù)中,并提供本體的概念和關(guān)系添加、修改操作。Protégé軟件是斯坦福大學(xué)醫(yī)學(xué)院生物信息研究中心基于Java語(yǔ)言開發(fā)的本體編輯和知識(shí)獲取軟件,或者說(shuō)是本體開發(fā)工具,也是基于知識(shí)的編輯器,屬于開放源代碼軟件。這個(gè)軟件主要用于語(yǔ)義網(wǎng)中本體的構(gòu)建,是語(yǔ)義網(wǎng)中本體構(gòu)建的核心開發(fā)工具。Protégé提供了本體概念類、關(guān)系、屬性和實(shí)例的構(gòu)建,并且屏蔽了具體的本體描述語(yǔ)言,用戶只需在概念層次上進(jìn)行領(lǐng)域本體模型的構(gòu)建。

22單元信息標(biāo)注

單元信息的標(biāo)注是單元信息知識(shí)庫(kù)建設(shè)的關(guān)鍵。智能自動(dòng)標(biāo)注在本領(lǐng)域己經(jīng)成為一項(xiàng)應(yīng)用較多的計(jì)算機(jī)語(yǔ)言技術(shù),自動(dòng)標(biāo)注包括詞語(yǔ)標(biāo)注、短語(yǔ)標(biāo)注、句法標(biāo)注[3]。由于語(yǔ)言本身包含信息的復(fù)雜性,使得標(biāo)注的內(nèi)容、對(duì)象可以在語(yǔ)法、語(yǔ)義、語(yǔ)用等各個(gè)層次上進(jìn)行,標(biāo)注的內(nèi)容和程度,從根本上決定了從文本中可以提取出的信息內(nèi)容和信息粒度,也決定了進(jìn)行文本內(nèi)容計(jì)算的對(duì)象、方法。比如對(duì)于文本快速準(zhǔn)確的標(biāo)出單元信息,并且將這些信息單元及其屬性等標(biāo)出,信息單元之間的多種關(guān)系也需要標(biāo)注,標(biāo)注后的文本以一定格式保存為便于計(jì)算識(shí)別的語(yǔ)料。這些復(fù)雜的標(biāo)注是一個(gè)費(fèi)時(shí)費(fèi)力的工作,所以開發(fā)一個(gè)界面友好的輔助標(biāo)注工具是非常必要的,并且是建設(shè)的需要。標(biāo)注工具可以提高標(biāo)注者的效率和標(biāo)注質(zhì)量,同時(shí)結(jié)構(gòu)化的輸出是面向內(nèi)容計(jì)算的需要。標(biāo)注系統(tǒng)的研究和開發(fā)還可以為內(nèi)容計(jì)算提供方法和服務(wù),可以為自動(dòng)標(biāo)注系統(tǒng)的研究提供方法和規(guī)律。所以,研究標(biāo)注系統(tǒng)具有非常重要的意義和作用。本平臺(tái)語(yǔ)詞標(biāo)注以自動(dòng)標(biāo)注與人工標(biāo)注相結(jié)合,以確保標(biāo)注的準(zhǔn)確性和科學(xué)性。

23索引設(shè)計(jì)

數(shù)據(jù)庫(kù)設(shè)計(jì)好壞的重要標(biāo)準(zhǔn)之一是具有快速的響應(yīng)速度,在本項(xiàng)目大數(shù)據(jù)處理的前提下,提升查詢響應(yīng)速度也是本項(xiàng)目數(shù)據(jù)庫(kù)的關(guān)鍵技術(shù)之一。索引是數(shù)據(jù)庫(kù)提升查詢性能最便捷、簡(jiǎn)單、有效的方法之一。本項(xiàng)目使用 SQL Server2008數(shù)據(jù)庫(kù)進(jìn)行索引的設(shè)計(jì)和優(yōu)化數(shù)據(jù)的查詢性能。索引允許程序迅速地找到表中的數(shù)據(jù),而不必掃描整個(gè)數(shù)據(jù)庫(kù) 。索引可以大大加快數(shù)據(jù)檢索速度,加速表與表之間的連接;使用 ORDER BY 和 GROUPBY 子句檢索數(shù)據(jù),可以顯著減少查詢中分組和排序的時(shí)間;可以在檢索數(shù)據(jù)的過(guò)程中使用優(yōu)化隱藏器,提高系統(tǒng)性能;通過(guò)創(chuàng)建唯一的索引,也可以保證數(shù)據(jù)記錄的惟一性。同時(shí)也要注意創(chuàng)建索引和維護(hù)索引需要耗費(fèi)時(shí)間與占用物理空間,這種時(shí)間隨著數(shù)據(jù)量的增加而增加,當(dāng)對(duì)數(shù)據(jù)進(jìn)行更新的時(shí)候,索引也要?jiǎng)討B(tài)地維護(hù)[4]。

24可視化顯示

數(shù)據(jù)可視化是利用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像在屏幕上顯示出來(lái),并進(jìn)行交互處理的理論、方法和技術(shù)。數(shù)據(jù)可視化是通過(guò)關(guān)系數(shù)據(jù)表來(lái)觀察和分析數(shù)據(jù)信息的方式,使人們能夠以更直觀的方式看到數(shù)據(jù)及其結(jié)構(gòu)關(guān)系,發(fā)現(xiàn)數(shù)據(jù)中隱含的信息。數(shù)據(jù)可視化的基本思想是將數(shù)據(jù)庫(kù)中的每個(gè)數(shù)據(jù)項(xiàng)作為一個(gè)圖形元素表示,例如,點(diǎn)、矩形條、扇形片等,大量的數(shù)據(jù)構(gòu)成數(shù)據(jù)圖像,同時(shí)將數(shù)據(jù)的各個(gè)屬性值以多維數(shù)據(jù)的形式表示,可以從不同的維度觀察數(shù)據(jù),從而對(duì)數(shù)據(jù)進(jìn)行更深入的觀察和分析[5]。本項(xiàng)目采用網(wǎng)絡(luò)圖的可視化展現(xiàn)方式展示數(shù)據(jù)點(diǎn)之間的錯(cuò)綜復(fù)雜的相互關(guān)系,也是一種常見(jiàn)的大數(shù)據(jù)展示方法。以網(wǎng)絡(luò)圖展示語(yǔ)義關(guān)系中的相關(guān)詞、上位詞、屬性、下位詞、應(yīng)用于、實(shí)例、屬性值、對(duì)象屬性、應(yīng)用方法等數(shù)據(jù),可以幫助讀者了解養(yǎng)生知識(shí)數(shù)據(jù)的結(jié)構(gòu)、關(guān)系以及動(dòng)態(tài)性。

3養(yǎng)生知識(shí)服務(wù)平臺(tái)功能實(shí)現(xiàn)

系統(tǒng)分別面向機(jī)構(gòu)用戶和讀者用戶開發(fā)了后臺(tái)管理系統(tǒng)和前臺(tái)檢索與上傳系統(tǒng)。后臺(tái)管理系統(tǒng)其主要包括對(duì)文獻(xiàn)庫(kù)的上傳、單元信息庫(kù)的標(biāo)注、知識(shí)庫(kù)的組織管理及對(duì)前臺(tái)用戶上傳標(biāo)注內(nèi)容的審核。用戶前臺(tái)則實(shí)讀者對(duì)單元信息的檢索顯示以及文獻(xiàn)上傳。由于用戶的專業(yè)水平不可見(jiàn)且水平不一,所以需要“機(jī)構(gòu)”管理員對(duì)其內(nèi)容進(jìn)行審核后才能進(jìn)行入庫(kù)和顯示。

31文獻(xiàn)庫(kù)上傳

文獻(xiàn)庫(kù)的構(gòu)成是由圖書館內(nèi)的圖書、期刊、報(bào)紙數(shù)字資源庫(kù)中挑選的與養(yǎng)生內(nèi)容相關(guān)的文獻(xiàn)。上傳獲取的信息包括文獻(xiàn)類型、題名、作者、主題、出版信息,支持PDF和txt文件?!爸黝}”為前臺(tái)主題瀏覽和知識(shí)檢索的類別所屬。其在養(yǎng)生原理、養(yǎng)生方法和養(yǎng)生應(yīng)用下設(shè)二級(jí)主題分類和最底層的主題詞。如養(yǎng)生應(yīng)用下設(shè)時(shí)節(jié)、人群、部位與疾病,時(shí)節(jié)分春夏秋冬,再分別冠以主題詞,為標(biāo)注和片段信息的組織建立最基本的關(guān)系。本平臺(tái)實(shí)現(xiàn)數(shù)字文獻(xiàn)的自動(dòng)信息獲取和整體文本上傳,這大大減少了圖書館在對(duì)信息組織再利用的過(guò)程中所要消耗的時(shí)間和精力。endprint

32單元信息標(biāo)注

單元信息標(biāo)注是養(yǎng)生單元信息知識(shí)庫(kù)建設(shè)中的關(guān)鍵環(huán)節(jié)。在文獻(xiàn)庫(kù)中進(jìn)行片段的選擇,在此部分進(jìn)行分頁(yè)展示所有片段的列表,可對(duì)片段進(jìn)行編輯,重新劃分片段,標(biāo)注主題詞,主題詞來(lái)自于本體知識(shí)庫(kù)。通過(guò)本體庫(kù)中主題詞之間的關(guān)系實(shí)現(xiàn)單元信息的語(yǔ)義關(guān)聯(lián)。平臺(tái)的標(biāo)注分為自動(dòng)標(biāo)注、自動(dòng)推薦備選標(biāo)注與手動(dòng)標(biāo)注。單元信息自動(dòng)標(biāo)注和推薦備選標(biāo)注是計(jì)算機(jī)自動(dòng)化的智能分析體現(xiàn),是基于信息單元之間的語(yǔ)義分析的結(jié)果。單元信息標(biāo)注過(guò)程可以充分應(yīng)用標(biāo)注者專業(yè)知識(shí)結(jié)構(gòu)背景,也是平臺(tái)的知識(shí)關(guān)聯(lián)網(wǎng)絡(luò)的構(gòu)建過(guò)程,其本身就是對(duì)知識(shí)的再組織再創(chuàng)造、是增值管理和有效利用的最佳方式[6]。單元信息標(biāo)注本身就是在各單元信息之間及每個(gè)單元信息內(nèi)部建立語(yǔ)義關(guān)系,體現(xiàn)了知識(shí)之間的語(yǔ)義關(guān)聯(lián),也為用戶知識(shí)利用、發(fā)現(xiàn)和再組織提供了最直接幫助[7]。

33本體知識(shí)庫(kù)管理

本體知識(shí)庫(kù)作為單元信息的標(biāo)注工具,其目的是建立領(lǐng)域本體。本體知識(shí)庫(kù)的管理分為主題分類組織、主題標(biāo)簽建立、語(yǔ)義關(guān)系生成三部分。其中主題分類為主題概念的類目體系等級(jí)關(guān)系的建立,隨時(shí)根據(jù)系統(tǒng)的需要進(jìn)行主題概念的增加、修改、刪除。主題標(biāo)簽是在類目體系的基礎(chǔ)上進(jìn)行主題詞的添加、修改和刪除操作。最后主題概念之間可以進(jìn)行語(yǔ)義關(guān)系的生成。語(yǔ)義關(guān)聯(lián)包括相關(guān)詞、上位詞、屬性、下位詞、應(yīng)用于、實(shí)例、屬性值、對(duì)象屬性、應(yīng)用……方法的語(yǔ)義關(guān)聯(lián)。語(yǔ)義關(guān)聯(lián)展示了所有主題詞的列表,可對(duì)主題詞進(jìn)行編輯、添加、刪除操作;對(duì)主題詞編輯語(yǔ)義關(guān)系;根據(jù)主題詞的類別篩選出主題詞和當(dāng)前主題詞進(jìn)行關(guān)聯(lián),主題詞的關(guān)系在前臺(tái)的瀏覽的可視化分析圖表中展示。

34用戶管理

包括前臺(tái)用戶注冊(cè)和后臺(tái)用戶上傳審核。對(duì)于圖書館這樣的公眾服務(wù)機(jī)構(gòu),有數(shù)十萬(wàn)的讀者用戶群,而其中不乏大量愿意貢獻(xiàn)自己智慧參與到“養(yǎng)生知識(shí)服務(wù)平臺(tái)”的知識(shí)庫(kù)的構(gòu)建的用戶,為了更大范圍的建設(shè)本平臺(tái)將知識(shí)庫(kù)建設(shè)對(duì)用戶進(jìn)行開放。用戶注冊(cè)采用互聯(lián)網(wǎng)用戶常規(guī)做法,用郵箱作為唯一ID,通過(guò)驗(yàn)證碼進(jìn)行驗(yàn)證激活。同時(shí)將手機(jī)號(hào)也作為注冊(cè)的必要信息進(jìn)行填寫,也可采用手機(jī)驗(yàn)證碼的方式,郵件與手機(jī)號(hào)在原理上是相同的。登陸時(shí)用用戶名和密碼進(jìn)行登錄。用戶上傳的流程與“機(jī)構(gòu)”后臺(tái)的流程相同,但是構(gòu)建完成后需要在“機(jī)構(gòu)”后臺(tái)進(jìn)行審核,審核后才能夠成為平臺(tái)知識(shí)的一部分。用戶在前臺(tái)上傳文獻(xiàn)、截取片段信息并對(duì)片段信息進(jìn)行標(biāo)注后提交到后臺(tái),后臺(tái)可進(jìn)行文獻(xiàn)內(nèi)容的整體查看,確認(rèn)是否通過(guò)審核。同時(shí)還可以查看片段信息的標(biāo)注內(nèi)容。

35知識(shí)檢索與可視化顯示

用戶對(duì)單元信息組織系統(tǒng)的知識(shí)檢索,實(shí)際就是利用知識(shí)關(guān)聯(lián)原理,在知識(shí)庫(kù)中獲取知識(shí)單元,或同時(shí)在知識(shí)庫(kù)直接獲取所需的單元信息,并通過(guò)單元信息的關(guān)聯(lián)關(guān)系實(shí)現(xiàn)新知識(shí)的衍生。通過(guò)單元信息檢索,用戶不但能跨各類別的單元信息。而且能從單元信息庫(kù)中直接獲得自己所需要的單元信息,還能基于關(guān)系網(wǎng)絡(luò)發(fā)現(xiàn)更多密切相關(guān)的單元信息知識(shí),進(jìn)而使用戶的知識(shí)需求得到全面滿足。檢索分為知識(shí)庫(kù)瀏覽檢索和主題詞檢索兩種方式。通過(guò)對(duì)知識(shí)庫(kù)主題概念分類體系的瀏覽,可以查看主題詞的詳細(xì)信息和主題詞的可視化分析圖表以及相對(duì)應(yīng)地單元信息??梢暬哉劬€、 曲線、曲面、柱型和三維圖形的方式展示數(shù)據(jù),可以幫助了解數(shù)據(jù)的結(jié)構(gòu)、關(guān)系以及動(dòng)態(tài)性。對(duì)在語(yǔ)義關(guān)系中的相關(guān)詞、上位詞、屬性、下位詞、應(yīng)用于、實(shí)例、屬性值、對(duì)象屬性、應(yīng)用方法進(jìn)行可視化圖譜顯示。如高血壓的可視化分析如圖2所示:

點(diǎn)擊任意主題詞則可顯示相關(guān)單元信息,同時(shí)在系統(tǒng)中可對(duì)任一主題詞進(jìn)行切換查看,依據(jù)主題詞之間的關(guān)聯(lián)關(guān)系實(shí)現(xiàn)單元信息之間的語(yǔ)義關(guān)聯(lián)。

主題詞檢索方式是對(duì)單元信息的直接檢索,不僅僅可以可按照關(guān)鍵字進(jìn)行檢索,還可以通過(guò)關(guān)鍵字和類別進(jìn)行高級(jí)檢索,檢索出文獻(xiàn)片段和相關(guān)的主題詞信息。類別的限定為季節(jié)、年齡、性別、部分與疾病,同時(shí)還可以進(jìn)行二級(jí)類別限定如對(duì)季節(jié)里的具體節(jié)氣可進(jìn)行限定,能夠讓用戶十分精準(zhǔn)的檢索到所需要的內(nèi)容。檢索結(jié)果按單元信息內(nèi)容、主題詞和來(lái)源進(jìn)行展示,同時(shí)可以進(jìn)行主題詞內(nèi)容切換,查看對(duì)應(yīng)單元信息內(nèi)容。

4結(jié)語(yǔ)

圖書館單元信息知識(shí)服務(wù)系統(tǒng)將知識(shí)組織的單位從文獻(xiàn)單元深入到文獻(xiàn)中的單元信息,海量文獻(xiàn)中所包含的單元信息及信息間的相關(guān)關(guān)系,這將產(chǎn)生極大的信息增值,從而大大推進(jìn)圖書館對(duì)知識(shí)的獲取和利用,促進(jìn)知識(shí)創(chuàng)新,推動(dòng)知識(shí)應(yīng)用的重大發(fā)展。 基于單元信息的養(yǎng)生知識(shí)服務(wù)平臺(tái),不僅實(shí)現(xiàn)了對(duì)文獻(xiàn)的單元信息提取和標(biāo)注,而且實(shí)現(xiàn)了單元信息間的主題鏈接和語(yǔ)義關(guān)聯(lián),進(jìn)而形成知識(shí)網(wǎng)絡(luò)和語(yǔ)義網(wǎng)。這必將對(duì)基于大數(shù)據(jù)的圖書館的知識(shí)發(fā)現(xiàn)、 挖掘和創(chuàng)新提供實(shí)踐應(yīng)用支持[8]。“養(yǎng)生知識(shí)服務(wù)系統(tǒng)”是對(duì)“面向大數(shù)據(jù)的單元信息組織研究體系”理論應(yīng)用的實(shí)踐,整體還不夠全面,技術(shù)上也還受到很多制約。今后將繼續(xù)研究和實(shí)踐,爭(zhēng)取將該項(xiàng)目落地實(shí)踐并向用戶提供知識(shí)服務(wù)。

參考文獻(xiàn)

[1]王薇.基于關(guān)聯(lián)數(shù)據(jù)的圖書館數(shù)字資源語(yǔ)義融合研究[D].南京:南京大學(xué),2013.

[2]杜文華.本體的構(gòu)建及其在數(shù)字圖書館中的應(yīng)用研究[D].武漢:武漢大學(xué),2008.

[3]徐赳赳,Jonathan J.Webster,復(fù)句研究與修辭結(jié)構(gòu)理論[J].外語(yǔ)教學(xué)與研究,1999,(4):16-22.

[4]鄧小善,數(shù)據(jù)庫(kù)索引設(shè)計(jì)的研究[J].中國(guó)科技信息,2006,(2:2):148-152.

[5]韓衛(wèi)國(guó),王勁峰,王海起,等.基于數(shù)據(jù)可視化的交通流量分析[J].武漢理工大學(xué)學(xué)報(bào),2004,28(5): 668-670.

[6]姜永常,楊宏巖,張麗波.基于知識(shí)元的知識(shí)組織及其系統(tǒng)服務(wù)功能研究[J].情報(bào)理論與實(shí)踐,2007,(1):38-40.

[7]文庭孝.知識(shí)單元研究述評(píng)[J].中國(guó)圖書館學(xué)報(bào),2011,(9):75-85.

[8]于良芝,攀振佳,程樂(lè)天.信息單元再認(rèn)識(shí)[J].圖書館雜志,2016,(7):4-11.

(本文責(zé)任編輯:孫國(guó)雷)endprint

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
基于大數(shù)據(jù)的小微電商授信評(píng)估研究
大數(shù)據(jù)時(shí)代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對(duì)傳統(tǒng)圖書出版的影響和推動(dòng)作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
原阳县| 凤城市| 荆州市| 德庆县| 婺源县| 莱阳市| 和静县| 汝州市| 黔西| 彭山县| 四子王旗| 庆阳市| 抚州市| 阿克| 岱山县| 桂平市| 石门县| 保山市| 大兴区| 焉耆| 盐边县| 吉木萨尔县| 嘉荫县| 西城区| 马山县| 浮梁县| 观塘区| 余江县| 五常市| 开江县| 徐汇区| 宜宾县| 突泉县| 五华县| 科技| 开原市| 即墨市| 阿坝县| 邹平县| 奉新县| 青冈县|