李雁翎
人天書店在當(dāng)今國內(nèi)圖書出版界享有盛名。由于合作機緣,筆者對它作為一個文化企業(yè)的文化涵養(yǎng)、行業(yè)素質(zhì)、職業(yè)作風(fēng)等印象,是一步一步地加深。了解了“人天品牌”的精神內(nèi)涵,看到了“人天品牌”生命的活力,以及它自我糾正、自我完善的前進歷程,感受到了企業(yè)以“服務(wù)為本”的自我控制能力。人天書店的成長歲月中的艱辛和輝煌在他們積累數(shù)年的年終總結(jié)報告即“人天檔案”中躍然紙上。
“人天書店是為圖書館提供專業(yè)化服務(wù)的專業(yè)化書店,建立以數(shù)據(jù)技術(shù)、網(wǎng)絡(luò)技術(shù)為核心,以檢索為引導(dǎo),以銷售為目標(biāo),以加工和物流相配套的業(yè)務(wù)流程?!边@是鄒進董事長為人天書店做的定位。人天書店順應(yīng)時代發(fā)展,利用現(xiàn)代信息技術(shù)維系用戶、服務(wù)用戶的企業(yè)的生命本質(zhì)。人天書店的信息化和數(shù)據(jù)加工技術(shù)的隊伍也在不斷地成長壯大,從幾個人的技術(shù)支持到現(xiàn)在的研究中心,從大專學(xué)歷的專業(yè)人員到研究生學(xué)歷。技術(shù)不斷提升,軟件產(chǎn)品不斷出新。
“人天編目數(shù)據(jù)平臺”是人天書店數(shù)字化服務(wù)的基礎(chǔ)
2010年,我與人天書店有了合作的機會,從此開啟更多的接觸。以往筆者關(guān)注的數(shù)據(jù)庫應(yīng)用研究領(lǐng)域擴展到了圖書行業(yè),而隨著大數(shù)據(jù)的火爆,數(shù)據(jù)挖掘、機器學(xué)習(xí)、深度學(xué)習(xí)的不斷升溫,我與人天書店的關(guān)系也越來越密切,鄒進董事長成為筆者的朋友和合作伙伴。
當(dāng)時,人天書店編目數(shù)據(jù)處理狀況遇到了“瓶頸”。應(yīng)該怎樣為企業(yè)服務(wù)?鄒進董事長滿腦子的想法,可是由于當(dāng)時企業(yè)的人力和技術(shù)局限,不能夠完全理解和解決“老總”的問題。于是我們商定建立科學(xué)先進的“人天編目數(shù)據(jù)平臺”的合作方向。
從“編目數(shù)據(jù)平臺”創(chuàng)建初期調(diào)研過程中,筆者了解到鄒進的“服務(wù)為先,與時俱進,不斷創(chuàng)新”的理念。當(dāng)時,人天書店為了更好地服務(wù)用戶,其中一項服務(wù)是為圖書館提供“圖書編目”數(shù)據(jù),由于圖書館使用的“圖書館管理信息系統(tǒng)”不同,圖書的編目數(shù)據(jù)有常用的兩種,即“CALIS編目規(guī)則”和“ 中文圖書編目規(guī)則”。在進行館配的業(yè)務(wù)中“兩碼切換”頻率十分頻繁,費時費力。為滿足用戶的需求,當(dāng)時人天書店不惜成本,一本書加工兩條編目數(shù)據(jù),鄒進看到提升工作效率和節(jié)省人力的空間,提出了“二碼合一”理念。在幾次交流過程中,筆者從根本不知道“編目”數(shù)據(jù)是什么的外行,到如今從編目中看到了無限的可能。
經(jīng)過雙方的不斷溝通,我們團隊設(shè)計開發(fā)了 “人天編目數(shù)據(jù)平臺”,實現(xiàn)“兩碼統(tǒng)一”基本需求,并創(chuàng)建了“人天碼”這一人天書店專用編目數(shù)據(jù)庫。這個編目數(shù)據(jù)加工系統(tǒng)更準(zhǔn)確地說,它不僅僅是一個編目數(shù)據(jù)加工的軟件系統(tǒng),我們更愿意稱之為“人天編目數(shù)據(jù)平臺”,它的功能可“無限”的延展,可與外界進行更“多元”交互,這個理想的狀態(tài)將隨著時間的推移不斷靠近。
在開發(fā)和實踐過程中,筆者發(fā)現(xiàn)了“編目”數(shù)據(jù)背后的魅力,看到了“編目”數(shù)據(jù)記錄的信息,可賦予一本圖書除內(nèi)容之外的其他內(nèi)涵?,F(xiàn)在人天書店已經(jīng)有編目數(shù)據(jù)數(shù)百萬條,利用大數(shù)據(jù)工具進行數(shù)據(jù)挖掘,將編目數(shù)據(jù)與銷售、編目數(shù)據(jù)與作者、編目數(shù)據(jù)與館藏等多維數(shù)據(jù)加以加工,他們將會有更多具有競爭力決策行為,直至可將服務(wù)延伸到具體的客戶服務(wù)終端。
“中國可供書目”是人天書店與用戶的紐帶
什么是“可供書目”?“知道有這本書,還要知道它在哪里?!惫P者想借題發(fā)揮一下:“可供書目,是出版信息與銷售信息一體的信息源,是圖書流通資訊?!比颂鞎甑目晒縿?chuàng)建,也經(jīng)歷了時間的磨礪。
人天書店在1999年就有了《人天書目報》,是人天書店為用戶提供的可供書目信息。這比2002年原新聞出版總署信息中心推出的可供書目,中國出版集團提出的可供書目,還要早上一兩年。2003年人天書店正式開創(chuàng)了“可供書目”項目,由于當(dāng)時沒有迫切的市場需要,加之技術(shù)手段落后,2004年此項目停止。同年中國出版集團成立了中版通公司,專門從事中國可供書目研究,但也因種種原因,無疾而終。憑借著敏銳的行業(yè)洞見力,在2012年編目數(shù)據(jù)平臺上馬之時,鄒進又一次提出要在“人天編目數(shù)據(jù)的平臺”基礎(chǔ)上建設(shè)“中國可供書目”網(wǎng)絡(luò)平臺的意見。經(jīng)過他們的努力建設(shè),現(xiàn)今平臺已經(jīng)面向用戶服務(wù)。
中國可供書目是一個現(xiàn)貨數(shù)據(jù)交換平臺。市場需求越來越迫切,而技術(shù)也越來越成熟,不需要把書都存在自己的庫里,通過數(shù)據(jù)交換格式,把出版社、批銷中心、文化公司都聯(lián)系在一起,經(jīng)銷商如有庫存,通過商務(wù)談判,就可以成為供貨商。
“中國可供書目”在理念和設(shè)計上都是無可置疑的,如果該平臺實現(xiàn)了“數(shù)據(jù)量的多少,決定了平臺的用戶的廣泛性,這取決于數(shù)據(jù)提供商與平臺接口方案和技術(shù)實現(xiàn),如果能夠?qū)崿F(xiàn)數(shù)據(jù)的提供者自動時時提供數(shù)據(jù),系統(tǒng)再為客戶端提供個性推送的智能服務(wù)、增強現(xiàn)貨信息及期貨信息的加工、配送服務(wù)功能”。這個平臺將會成為人天書店的拳頭產(chǎn)品,一個連接“已知”與“未知”的平臺會越來越引人注目,這在當(dāng)今的大數(shù)據(jù)時代,又走在了全國業(yè)界的前頭。
核心書目評價體系
高校合并和擴招,使原來的單一型、專業(yè)型學(xué)校,組合成多學(xué)科的綜合性大學(xué),這又帶來了高校圖書館館藏需求的多樣性,對圖書采訪員的專業(yè)要求也大大提高了。大多數(shù)的采訪員,對于不過一萬種中文期刊,可依賴《中文核心期刊要目總覽》提供采購方案。而圖書采訪員面對每年出版的超過40萬種的圖書,有時就不知如何“采購”,如果再加上前一兩年的圖書,過百萬的品種,更是要用上一番功夫。
人天書店想用戶所想,他們從上海師范大學(xué)圖書館的一項研究成果中獲得了靈感,提出了“圖書的核心書目評價體系”,要用“核心書目”來輔助圖書采訪員,使之更有效、更準(zhǔn)確地判斷圖書的質(zhì)量和價值。試圖通過核心書目,幫助圖書館采購專業(yè)圖書,可以通過專業(yè)院系師生需求信息,按需篩選可購圖書。這樣便可以實現(xiàn)具有圖書情報專業(yè)知識和管理經(jīng)驗的采訪人員精準(zhǔn)地挑選各種專業(yè)書籍。這個想法,也促使我們團隊的研究聚焦到了“核心書目”提取方法上。
上海師范大學(xué)圖書館提出:“將某個時段的書目集中起來,再把哲社類學(xué)術(shù)圖書分離出來,對這部圖書用引文分析和二八定律遴選,最后經(jīng)相關(guān)專家審定,形成哲社類學(xué)術(shù)圖書的核心書目,這個書目可以作為館藏質(zhì)量測評的工具”。這個基于“專家主觀評價”的成果,以及人天書店業(yè)務(wù)專家的建議,對我們后來的研究啟發(fā)很大。2013年8月,我們從數(shù)據(jù)挖掘應(yīng)用出發(fā),提出了“五維圖書評價體系及分析模型的建構(gòu)”,有了“圖書評價”的初步方法(論文見《情報科學(xué)》2013年第3期)。
2013年10月,在東北師范大學(xué)計算機科學(xué)和信息技術(shù)學(xué)院,由人天書店共建的“東北師范大學(xué)圖書物聯(lián)網(wǎng)研究所”成立,開啟核心書目項目的進一步研究。
人天書店提出了依賴書目的來源創(chuàng)建圖書的評價體系,讓圖書館的采訪人員在沒有看到書的情況下,面對采訪數(shù)據(jù),就能大致判斷出哪些是好書,哪些圖書符合自己的館藏要求,并在采訪數(shù)據(jù)中產(chǎn)生核心書目。根據(jù)好書因子對圖書進行評價的理念進行設(shè)計,給出評價體系。
2015年,東北師范大學(xué)圖書物聯(lián)網(wǎng)研究所,基于大數(shù)據(jù)通過數(shù)據(jù)挖掘和機器學(xué)習(xí)等數(shù)據(jù)分析工具,修正了“五維圖書評價模型”,并創(chuàng)建了全國500多家出版社,22大門類圖書出版質(zhì)量動態(tài)評估系數(shù)集。在此基礎(chǔ)上,根據(jù)人天書店需求給出的基于統(tǒng)計規(guī)則的評價指標(biāo),我們開發(fā)“核心書目系統(tǒng)”軟件。實現(xiàn)了對于已經(jīng)出版發(fā)行的圖書進行“客觀的評價”和“專家糾偏”數(shù)據(jù)計算,對每一本圖書進行100分評測,為圖書采購人員提供采購參考。
正如自然界的優(yōu)勝劣汰、適者生存,一個產(chǎn)品或一種服務(wù)為萬人所用的時代已經(jīng)漸進消亡,一萬個產(chǎn)品或一萬種服務(wù)為滿足一個人需求的時代正在開啟,大數(shù)據(jù)時代昭示著智能生產(chǎn)、智能服務(wù)、個性化供給和個性化服務(wù),供需對接會越來越精準(zhǔn)。這種思路和行為套用當(dāng)今的一句流行的話說,就是圖書發(fā)行行業(yè)的“供給側(cè)”改革。在大數(shù)據(jù)時代,在數(shù)據(jù)“說話”的今天,面對不確定的未來,相信人天書店一定會走在行業(yè)的前列,成為“企業(yè)數(shù)字化”“數(shù)字化服務(wù)企業(yè)”的品牌企業(yè)。人天書店的編目數(shù)據(jù)、可供書目、核心書目,定會創(chuàng)造無限的“數(shù)據(jù)價值”。人天書店將會為更多的用戶提供更多服務(wù)的可能性。
(作者系東北師范大學(xué)計算機科學(xué)與信息技術(shù)學(xué)院教授、博士生導(dǎo)師、圖書物聯(lián)網(wǎng)研究所所長)