陳雅
(廣州圖書館,廣東 廣州 510055)
基于Delphi的日文圖書著者號碼查詢軟件的設(shè)計
陳雅
(廣州圖書館,廣東 廣州 510055)
通過對日文編目著者號查詢規(guī)則的分析,根據(jù)國內(nèi)使用現(xiàn)狀和編目工作流程給出了獨(dú)立通用查詢軟件的可行性設(shè)計方法,利用Delphi技術(shù)設(shè)計并實現(xiàn)了該查詢軟件,并簡要分析了Delphi編程的基本步驟。
Delphi 數(shù)據(jù)庫 著者號碼 編目工作
圖書館文獻(xiàn)編目是指以一定的目的和使用對象,按照相應(yīng)的方法及其規(guī)則將無序的眾多文獻(xiàn)轉(zhuǎn)化為有序的文獻(xiàn)集合,為文獻(xiàn)檢索提供依據(jù)的工作。日文編目中一項最基本的工作就是依據(jù)植村著者號碼表來生成日文圖書的著者號碼,用以確定同類圖書的先后次序。
目前,圖書編目信息化日益增強(qiáng),而日文圖書著者號碼——基于植村著者號碼表生成著者號仍是用手工方式,市面上流行的各種編目系統(tǒng)(如匯文、ILAS、圖創(chuàng))都未集成植村著者號的自動生成功能,圖書采編人員也沒有做這方面研究,筆者分析主要有兩方面原因:一是日文圖書在圖書館收藏中只占很小一部分,屬于小語種。由于數(shù)量小,很多圖書館對日文圖書的處理不夠重視,使日文圖書取著者號碼仍處于手工查找階段。二是著者號的生成只是整個圖書編目工作的一個小的環(huán)節(jié),這一工作的自動化、智能化往往被編目員或者系統(tǒng)提供商忽略。
而實際上植村號碼表基于日文字符的拼寫需要編目員對日文有一定的了解,但是國內(nèi)許多圖書館的外文圖書編目人員一般是以英語為第一外語,對日文并不十分精通。且每一次查找日文字符(日文字符有很多形狀大小相似的需要區(qū)分),編目員僅用肉眼識別和查找,不僅耗時也耗精力,一定程度上會降低編目速度和準(zhǔn)確率,影響圖書館日文數(shù)據(jù)庫質(zhì)量。因此,編寫植村表著者號碼查詢軟件是很有必要的。
筆者討論了一種利用Delphi技術(shù)設(shè)計的植村表著者號碼查詢軟件。該系統(tǒng)只需要輸入日文平假名或者片假名的名字,系統(tǒng)自動生成正確的著者號碼,避免了編目員手誤產(chǎn)生的字符錯誤及肉眼看錯數(shù)字等情況,提高了取號的速度和準(zhǔn)確率,有利于讀者使用圖書館資源。
2.1 植村表著者號碼查詢軟件編寫流程
整理日文植村表的使用細(xì)則→確定基本字符庫→編寫查找程序語言→程序檢驗及使用反饋。
2.2 整理日文植村表和確定基本字符庫
日文圖書著者號碼,國內(nèi)圖書館通常采用植村長三郎編的《日本著者號碼簡明表》,簡稱“植村表”。植村表包括正表和附表(著者區(qū)分用)。下表為植村表(正表)的一部分。
表1 植村表(正表)的一部分
植村表的使用要點(diǎn)如下:
①著者號是取著者姓氏頭兩個假名,在正表上查出第二個假名的代號,再冠以第一個假名,兩者組配而成。例如:植村(ウエムラ):第二個假名是エ,查正表知其代號為07,再冠以第一個假名ウ而成ウ07、即是植村一姓的著者號。
②濁音、半濁音與清音同樣處理。濁音就是與清音字符形狀一樣,“肩膀”上有兩點(diǎn)的字符,如:“ヴガギグゲゴザジズゼゾダヂヅデドバビブベボ”;半濁音就是與清音字符形狀一樣,“肩膀”上有一個圓圈的字符,如:“パピプペポ”。
③促音、拗音的處理。促音是不發(fā)音的,是在它的前后兩個音間停頓一下。促音字型和清音一樣,字型大小比清音小一半,編目員要避免兩種字符混淆;拗音就是清音、濁音、半濁音的“い”段音和小寫的“ゃ、ゅ、ょ”配合起來構(gòu)成的音節(jié)。
④植村表的片假名是以發(fā)音式的讀法為原則。把“ヰヱヲ”包括在“イエオ”里(“ヰヱヲ”與“イエオ”音同)。
⑤植村表只有片假名,在實際工作中,常有著者名為平假名形式需要編目員轉(zhuǎn)換為片假名。
根據(jù)以上列出的5個要點(diǎn),制作了“基本字符庫”(表2)。
表2 “基本字符庫”的一部分
3.1 植村表著者號碼查詢軟件程序的功能
植村表著者號碼查詢軟件程序設(shè)計目標(biāo)是能夠快速、簡單地查配植村表號碼,提高日文編目的質(zhì)量和效率。它的簡單工作流程如下:
輸入查找數(shù)據(jù)→數(shù)據(jù)庫中檢索→配置成植村表號碼輸出
植村表著者號碼查詢軟件要實現(xiàn)的是在查詢框輸入日文著者姓名后,在輸出窗口中顯示“著者姓氏的第一個字母(片假名清音)+著者姓氏的第二個字母(假名)的數(shù)字號碼”的樣式。如:日文著者“ウエムラ,キョウイチ”,輸入查詢框后,顯示結(jié)果是“ウ07”。
3.2 建立數(shù)據(jù)庫
3.2.1 數(shù)據(jù)庫的選擇
植村表著者號碼查詢軟件是一個比較小的應(yīng)用系統(tǒng),它產(chǎn)生和處理的數(shù)據(jù)量也比較小,因此沒有必要使用像SQL Server和Oracle這樣的大型數(shù)據(jù)庫??梢赃x擇Access組件建立數(shù)據(jù)庫,并根據(jù)“基本字符庫”創(chuàng)建一個名為“zcdb.mdb”的數(shù)據(jù)庫。
3.2.2 建立數(shù)據(jù)庫連接
根據(jù)“基本字符庫”創(chuàng)建Access數(shù)據(jù)庫文件“zcdb.mdb”,然后基于ODBC來建立Delphi應(yīng)用程序與數(shù)據(jù)庫文件連接。因為植村表著者號碼查詢軟件主要針對的是“基本字符庫”的查詢,并且不作修改添加等工作,“基本字符庫”是不可更改的。為了使用安全快捷,利用ODBC訪問本地機(jī)的“基本字符庫”。
在Delphi應(yīng)用程序中,通過數(shù)據(jù)集組件來訪問數(shù)據(jù)庫。一個數(shù)據(jù)集對象就代表了數(shù)據(jù)庫的一張表格、對數(shù)據(jù)庫的一次查詢結(jié)果集或者一次數(shù)據(jù)運(yùn)算后的結(jié)果。常用的數(shù)據(jù)集組件有TTable,TQuery。本程序中使用的是TQuery組件。
TQuery組件是開發(fā)數(shù)據(jù)庫應(yīng)用程序中最常用的組件,也是最重要的組件之一,TQuery對象對應(yīng)數(shù)據(jù)庫中的一次條件查詢的結(jié)果集。TQuery組件最大的特點(diǎn)是“支持結(jié)構(gòu)化查詢語句(簡稱SQL語句)”,能夠非常方便高效地實現(xiàn)各種條件查詢。
利用TQuery組件訪問數(shù)據(jù)庫之前,需要確認(rèn)ODBC數(shù)據(jù)源已經(jīng)建立,這就需要在“控制面板”中的ODBC數(shù)據(jù)源管理器中創(chuàng)建“datasource.dsn”數(shù)據(jù)源,并且可以成功地鏈接到數(shù)據(jù)庫中。
3.3 關(guān)鍵步驟的源代碼
3.3.1 第一字符:輸入日文人名,在基本字符庫查找,第一個字符若為清音字符保留,非清音字符則取同橫行的清音。為了避免人為輸入字符的錯誤,在正式進(jìn)行查詢之前,需要進(jìn)行一些容錯的處理。程序語言如下:
3.3.3 兩個字符結(jié)合后在設(shè)計界面顯示最后結(jié)果。程序語言如下:
Edit2.Text:=Edit2.text+ADOQuery1.Fields[0].value;
3.4 界面設(shè)計
根據(jù)植村表的特點(diǎn)和用戶使用便利的需求,植村表界面如圖1。
圖1
該程序界面是通過可視化設(shè)計,無需編寫程序代碼。考慮到用戶使用需求,特別把查找后顯示結(jié)果的顯示框設(shè)定為淺灰色,讓用戶更清晰明了。該設(shè)計程序語言如下:Edit2.color:=clMenu;
4.1 優(yōu)點(diǎn)
第一,杜絕了清音和促音字符混淆的錯誤:原來沒有植村表著者號碼查詢系統(tǒng)的時候,如編目員并不精通日語,在取號時容易將日文字符辨認(rèn)錯誤或者輸入錯誤。比如說,清音和促音字符形狀一樣,編目員由于手誤會把促音字符輸入系統(tǒng),造成索取號取號錯誤。
第二,杜絕了濁音、半濁音字符混淆的錯誤:由于濁音、半濁音按清音處理,部分編目員由于對規(guī)則不熟悉,把濁音、半濁音放在索取號首字符上。
第三,杜絕了編目員手工查找不準(zhǔn)確的錯誤:由于編目員用肉眼對照表格的字符查找相應(yīng)的數(shù)字,會出現(xiàn)看錯數(shù)字或者手誤輸錯數(shù)字的情況。
第四,提高了編目員取號的速度。
4.2 使用效果反饋
準(zhǔn)確率方面:可以原來用人工取號可能產(chǎn)生的輸錯字符、找錯數(shù)字的情況。使用該軟件,廣州圖書館編目的近600種日文數(shù)據(jù),取索取號準(zhǔn)確率達(dá)100%。
速度方面:原來用紙質(zhì)表人工查找,速度比較慢,一天只能做15種,其中取日文索取號需要用大量時間,每取一個大約需3~5分鐘。用了該軟件后,取索取號時間僅為1秒,大大提高了速度。
回溯糾正錯誤方面:對舊數(shù)據(jù)進(jìn)行回溯修改,在回溯的約1000種數(shù)據(jù)中,訂正數(shù)據(jù)約18.5%。雖然植村表著者號碼查詢軟件只是一個小小的數(shù)據(jù)庫應(yīng)用程序,但是大大提高了日文編目的工作效率,減少了工作失誤率,提高了索取號的準(zhǔn)確率。
[1]鄭阿奇,陳瑞芬.Deliphi編程教程[M].北京:電子工業(yè)出版社,2013.
[2]北京圖書館.圖書館目錄(下冊)[M].北京:中華書局,1957:79-86.
[3]陳雅.如何利用在線資源進(jìn)行日文編目[J].圖書館建設(shè),2008(5):54-56.
[4]植村長三郎.日本植村長三郎著者號碼表.北京圖書館東方語文編目組譯.[出版地不詳]:[出版者不詳],1957.
陳 雅女,1980年生。本科學(xué)歷,館員。研究方向:文獻(xiàn)編目。
G254.131
2014-01-06;責(zé)編:楊新寬。)