基于圖書索書號識別的在架圖書錯序檢測方法*

2023-02-17 09:46:24王紅芳宣靜雯

新世紀(jì)圖書館 2023年1期

王紅芳武薛宣靜雯

0 引言

目前，高校圖書館普遍采用藏、借、閱一體化的開放式流通模式，該方式不僅提高了圖書資源的流通效率，而且極大地滿足了讀者對圖書資源的多樣化和個性化需求，對發(fā)揮圖書的利用價值起到了積極推動作用[1]。然而，在高校圖書館采用開架閱覽的過程中，部分讀者在瀏覽、借閱圖書時，由于行為不規(guī)范等原因[2]，普遍存在亂放錯放現(xiàn)象，導(dǎo)致從數(shù)據(jù)庫查詢到的圖書位置信息與圖書在書架上的實際存放位置不一致[3-4]，給讀者借閱圖書帶來不便，嚴(yán)重影響了館藏圖書的流通效率和圖書館流通服務(wù)質(zhì)量[5]。因此，借助圖像處理和模式識別技術(shù)解決在架圖書串架錯序問題，對提高圖書館的運行管理效率和智能化管理水平具有重要的意義。

隨著圖書館開放式借閱的日益普及，以及圖書館藏書量和讀者數(shù)量的日益增多，圖書錯架、串架現(xiàn)象也日益嚴(yán)重。盡管現(xiàn)在國內(nèi)大多數(shù)圖書館基本實現(xiàn)了以條形碼[6-7]或無線射頻技術(shù)（RFID）[8-10]結(jié)合數(shù)據(jù)庫管理技術(shù)為基礎(chǔ)的圖書管理系統(tǒng)[11]，但是依然需要手工方式完成圖書上下架、圖書錯序整理等工作，圖書整理成為一項耗時、費力、易錯的常規(guī)性工作，導(dǎo)致了圖書流通過程中人力資源成本的增加。

針對圖書館開放式流通中圖書亂架錯序問題，不少研究者從如何規(guī)范讀者圖書借閱意識、提高管理者工作熱情度方面進(jìn)行了研究。例如，梁秀玉從亂架因素進(jìn)行剖析，從提高讀者借閱素質(zhì)、提高圖書館管理者工作水平和合理布局開架閱覽室等方面提出了對策[12]。段小嬌提出利用計算機(jī)統(tǒng)計讀者借閱次數(shù)，按照圖書流通率劃分存書區(qū)域，以保證區(qū)域圖書擺放的正確性。盡管以上方法對減少圖書亂架具有一定效果，但顯著增加了圖書管理員的工作量，而且對圖書館館藏物理空間大小有特殊的要求[13]。徐大芳等人針對圖書亂架提出了一種不同顏色的索書號標(biāo)簽表示不同類別的圖書的方法[14]。楊軍提出了一種結(jié)合圖書索書號和圖書的購買時間的排架方式[15]。陳倩等人提出讀者將借閱的圖書歸還中轉(zhuǎn)書架上統(tǒng)一管理、建立監(jiān)督圖書管理者定期巡架機(jī)制、圖書館定期安排講座活動等多個方法[16]。盡管上述方法在一定程度上減少了圖書亂架現(xiàn)象，但仍然解決不了圖書亂架的根本問題。

此外，研究者們也提出通過改善圖書館基礎(chǔ)設(shè)施的方法解決圖書館圖書亂架問題?？岛槔椎热颂岢隼靡苿釉O(shè)備采集在架圖書圖像，利用LSD算法檢測書脊邊緣，并通過投影分離出索書號區(qū)域中字符，然后使用CNN網(wǎng)絡(luò)對字符進(jìn)行識別，并結(jié)合圖書管理系統(tǒng)實現(xiàn)錯序檢測[17]。方建軍等提出了一種基于HSV空間分布特征與霍夫變換結(jié)合對書脊邊緣檢測、圖書索書號提取分割的算法[18]。蘇志芳等人根據(jù)圖書書脊圖像特點，利用機(jī)器視覺技術(shù)和無線網(wǎng)絡(luò)傳輸技術(shù)，設(shè)計并實現(xiàn)了一種基于嵌入式的圖書亂架識別系統(tǒng)[19]。上述方法能較好地實現(xiàn)對一般索書號在架圖書較好的錯序檢測，為圖書館圖書的自動化整理提供一種可行的方案。然而，這些方法涉及的經(jīng)驗閾值較多，檢測性能受環(huán)境因素和采集圖像質(zhì)量的影響較大。

本文在研究已有圖書亂架檢測方法的基礎(chǔ)上，通過移動設(shè)備獲取圖書館在架圖書圖像，首先使用Canny邊緣檢測和概率Hough變換直線檢測方法，實現(xiàn)單本圖書的書脊檢測與分割；然后在HSV顏色空間實現(xiàn)對索書號標(biāo)簽區(qū)域的分割，最后使用光學(xué)字符識別技術(shù)識別索書號，通過在架圖書的索書號排列規(guī)則進(jìn)行錯序分析，并標(biāo)記錯序圖書在書架上的位置。本文方法能應(yīng)用到圖書館在架圖書錯序檢測系統(tǒng)中，對構(gòu)建基于巡架機(jī)器人的圖書亂架清點系統(tǒng)具有重要的應(yīng)用價值。

1 書脊檢測與分割

書脊檢測與分割是實現(xiàn)圖書串架檢測的第一步，如圖1是書脊的檢測與分割流程圖。首先，通過移動圖像采集設(shè)備獲取在架圖書圖像，然后對在架圖書圖像進(jìn)行灰度變換、圖像增強(qiáng)等預(yù)處理后，采用Canny邊緣檢測算法檢測書脊邊緣信息，然后對邊緣檢測結(jié)果進(jìn)行概率Hough變換，提取書脊邊緣直線信息后，再對提取的邊緣直線進(jìn)行過濾處理，得到正確的書脊邊緣直線，最后根據(jù)書脊邊緣直線分割出單本書脊，并完成在架圖書的數(shù)量統(tǒng)計。

圖1 書脊的檢測與分割流程圖

1.1 書脊檢測

為實現(xiàn)圖書索書號的識別，首先需要實現(xiàn)圖書書脊區(qū)域的檢測。利用邊緣檢測算法可以有效提取圖書書脊邊緣，從而實現(xiàn)對索書號區(qū)域的準(zhǔn)確分割。常用的邊緣檢測算法有Roberts邊緣檢測算子、Sobel邊緣檢測算子、Prewitt邊緣檢測算子、LOG邊緣檢測算子和Canny邊緣檢測算子。如果像素點是邊緣上的點，那么該點在灰度導(dǎo)數(shù)中表現(xiàn)為一階的局部極值和二階的零交叉點。為了避免噪聲影響，提高微分運算獲取邊緣的可靠性，對采集的彩色圖書圖像首先進(jìn)行灰度化和中值濾波預(yù)處理操作。由于Roberts、Sobel和Prewit算子均屬于一階邊緣檢測器，如果計算出某個像素點的一階導(dǎo)數(shù)大于某一閾值，就認(rèn)為是邊緣點，因此這三種邊緣檢測子對噪聲比較敏感，容易將邊緣信息誤認(rèn)為是噪聲，不利于后續(xù)的書脊分割。相比而言，LOG邊緣算子引入了高斯濾波和各向同性的拉普拉斯兩階差分算子，對噪聲具有較好的魯棒性，而Canny邊緣算子是在LOG邊緣算子基礎(chǔ)的一種更有效的邊緣檢測方法，邊緣檢測效果更好[20]。本文使用Canny邊緣檢測算子進(jìn)行書脊邊緣的檢測。

在完成圖書書脊邊緣提取后，采用概率霍夫變換（Probability Hough Transform）算法實現(xiàn)對書脊邊緣的提取。概率霍夫變換是在霍夫變換直線檢測的基礎(chǔ)上實現(xiàn)線段的查找，它對圖像中的一些長的線段分割效率較高，并能夠檢測到每個線段的起點和終點，有利于提取準(zhǔn)確的書脊邊緣。

1.2 書脊分割

對于實際的在架圖書，同一書脊線通過概率霍夫變換檢測出來的書脊邊緣往往由多個不連續(xù)的邊緣直線組成。而且筆者在實驗中發(fā)現(xiàn)，利用概率霍夫變換檢測到的直線段位置是隨機(jī)排列的，因此需要將檢測出的直線進(jìn)行排序、過濾和合并，以實現(xiàn)單本圖書書脊的準(zhǔn)確分割。為此，先將檢測的直線按照起點或終點的行坐標(biāo)進(jìn)行排序，然后設(shè)定線段間隔閾值，如果相鄰兩條線段的水平間隔小于該閾值，可將這兩條線段合并成一條直線，否則不做處理。通過對書脊邊緣直線濾除，能有效濾除無效的書脊邊緣，從而獲得更加準(zhǔn)確有效的書脊邊緣區(qū)域。

在對圖像進(jìn)行預(yù)處理、書脊邊緣檢測、書脊邊緣提取等一系列處理后，最后對單本書脊進(jìn)行分割。書脊分割結(jié)果如圖2所示。由圖2書脊分割結(jié)果可知，當(dāng)確定單本書脊的左右邊緣位置后，可以根據(jù)書脊左右兩邊緣線段的起點和終點坐標(biāo)對原圖像進(jìn)行裁剪，實現(xiàn)單本書脊逐一分割，然后將分割出的單本書脊整齊排列到一張白色圖像上，并統(tǒng)計分割的書脊數(shù)量，生成所需要的書脊分割圖像。

圖2 書脊分割結(jié)果

1.3 索書號區(qū)域定位

在分割出單本書脊圖像后，接下來需要定位圖書書脊下方的索書號區(qū)域，然后識別索書號字符，并根據(jù)識別出的索書號進(jìn)行錯序分析。索書號標(biāo)簽分割流程圖如圖3所示。依照索書號標(biāo)簽分割流程，首先獲取書本索書號標(biāo)簽的紅色邊緣圖像，然后獲取紅色邊緣圖像的色調(diào)H通道和飽和度S通道，接著分別計算H通道和S通道的灰度直方圖，根據(jù)灰度直方圖確定H通道和S通道的閾值范圍，然后根據(jù)閾值確定索書號標(biāo)簽的位置分割出索書號標(biāo)簽區(qū)域，然后識別索書號字符，并根據(jù)識別出的索書號進(jìn)行錯序檢測。

圖3 索書號標(biāo)簽分割流程圖

在獲得圖書書脊分割結(jié)果后，針對分割出的書脊進(jìn)行感興趣區(qū)域定位，感興趣區(qū)域（Regions of Interest，ROI）是進(jìn)一步處理的重點關(guān)注目標(biāo)區(qū)域。本文的感興趣區(qū)域即是索書號標(biāo)簽區(qū)域，能否準(zhǔn)確地提取索書號標(biāo)簽區(qū)域，直接影響索書號識別的準(zhǔn)確度。目前，ROI提取算法很多，常用的算法有HSV顏色空間算法、卷積神經(jīng)網(wǎng)絡(luò)提取算法、形態(tài)學(xué)定位算法。由經(jīng)驗可知，一般情況下，索書號標(biāo)簽區(qū)域都有其固定的特征，如顏色、形狀、尺寸、位置等。以西安工程大學(xué)圖書館藏書為例，通常索書號標(biāo)簽上下各有一條紅色邊線，索書號字符為黑色，背景顏色為白色，二者顏色相差較大，索書號寬高比有一定比例等特征，這些都是分割索書號標(biāo)簽區(qū)域的先驗信息[16]。根據(jù)這些先驗特征信息，由于顏色分量R、G、B之間的相關(guān)性較高，而H、S、V能較好地反映人眼對顏色的主觀感受，為保證后續(xù)識別效果，本文將分割出的RGB書脊圖像變換到HSV顏色空間提取索書號標(biāo)簽區(qū)域。在HSV顏色空間，色調(diào)分量H和飽和度分量S反映了色彩的本質(zhì)特性，而V分量反映圖像的亮度，因此可以分析書脊區(qū)域H分量和S分量的顏色直方圖確定分割閾值，以消除圖像亮度變化對索書號區(qū)域分割的影響。

為了確定索書號標(biāo)簽區(qū)域，本文對方建軍等人提出的索書號標(biāo)簽區(qū)域直方圖統(tǒng)計方法[18]加以改進(jìn)，通過對大量索書號標(biāo)簽的上下紅色邊線進(jìn)行直方圖統(tǒng)計確定分割閾值。利用直方圖確定紅色標(biāo)簽的色調(diào)分量H和飽和度分量S的值域，從而確定H分量和S分量取值范圍，進(jìn)而提取得出索書號標(biāo)簽區(qū)域。為了確定H分量和S分量的具體閾值范圍，需要對大量的索書號標(biāo)簽的紅色邊線進(jìn)行灰度直方圖統(tǒng)計，選出出現(xiàn)頻率高的公共區(qū)間，即為某一分量的閾值范圍。以色調(diào)H為例，對大量的索書號標(biāo)簽的紅色邊線的H值進(jìn)行排序，得到顏色分布直方圖，選出分布概率較高的區(qū)間作為H分量的值域。采用類似方法可得到S分量值域[18]。通過上述的直方圖統(tǒng)計方法確定索書號區(qū)域的H、S分量的閾值范圍如表1所示（以西安工程大學(xué)圖書館圖書索書號標(biāo)簽顏色特征為例）。

表1 索書號標(biāo)簽HSV分量閾值范圍

將RGB圖像轉(zhuǎn)換成HSV圖像后，對在閾值范圍內(nèi)的圖像區(qū)域置為1，即為白色，閾值范圍外的目標(biāo)圖像置為0，即為黑色。在黑色的背景下更容易提取到索書號標(biāo)簽的準(zhǔn)確位置。通過確定索書號標(biāo)簽位置，再通過邊緣坐標(biāo)將索書號標(biāo)簽切割出來。索書號標(biāo)簽的分割結(jié)果如圖4所示。可以看出，索書號上下邊緣所在位置為白色，其余部分為黑色，根據(jù)白色像素的位置即可確定索書號位置，從而實現(xiàn)索書號標(biāo)簽區(qū)域的正確分割。

圖4 索書號區(qū)域分割結(jié)果

2 索書號識別與錯序檢測

2.1 索書號識別

將分割出的索書號標(biāo)簽作為輸入圖像，利用pytesseract庫對圖像中的字符進(jìn)行識別[20]。pytesseract能夠從圖片中識別和“讀取”其中嵌入的字符。字符識別結(jié)果如圖5所示。

圖5 字符識別結(jié)果

2.2 索書號錯序檢測

在識別出索書號字符后，計算每個字符對應(yīng)的ASCII碼，逐位比較當(dāng)前索書號與相鄰前一索書號對應(yīng)位置的ASCII碼的大小。若相鄰前一索書號的ASCII碼小于等于當(dāng)前索書號的ASCII碼，則繼續(xù)比較下一位ASCII碼，直到所有位ASCII碼比較完成或出現(xiàn)相鄰前一索書號的ASCII碼大于當(dāng)前索書號的ASCII碼為止。如果所有位的ASCII碼都滿足相鄰前一索書號的ASCII碼小于或等于當(dāng)前索書號的ASCII碼，則相鄰前一本書與當(dāng)前書位置正確，否則可以判斷當(dāng)前圖書在書架上的排放發(fā)生錯序。同理，可以使用相同的方法判斷當(dāng)前圖書與相鄰的后續(xù)圖書的排序關(guān)系，后續(xù)圖書的索書號的ASCII碼必須大于或等于當(dāng)前索書號的ASCII碼。當(dāng)且僅當(dāng)書架上的所有圖書滿足“前者索書號<=當(dāng)前索書號<=后者索書號”的條件，則說明當(dāng)前書架上的圖書擺放位置正確，否則存在錯序。錯序檢測過程如圖6所示。

圖6 錯序檢測過程

3 結(jié)果分析

為進(jìn)一步驗證本文方法對實際在架圖書是否存在錯序的檢測效果，使用Pycharm中PyQt5工具設(shè)計Windows平臺下的應(yīng)用程序，利用OpenCV-Python4.4.0版本和pytesseract庫實現(xiàn)所有算法。利用移動手機(jī)圖像采集設(shè)備獲取50幅西安工程大學(xué)圖書館在架圖書圖像進(jìn)行驗證實驗，每幅圖像采自同一書架的一排圖書。表2是實驗中測試圖像的測試結(jié)果。

表2 測試結(jié)果

由表中結(jié)果可以看出，對采集的50張在架圖書圖像進(jìn)行測試，成功分割出單本書脊圖像的有46張，書脊分割準(zhǔn)確率達(dá)92%，能正確檢測出圖書錯序信息的有42張，總錯序檢測準(zhǔn)確率為84%，能夠滿足本系統(tǒng)的設(shè)計要求。

對書架上排放錯序的圖書，檢測時系統(tǒng)自動使用紅色的矩形框標(biāo)記出它在書架上的位置，以方便圖書管理員快速定位錯序圖書的位置并進(jìn)行整理。盡管本文方法正確檢測出圖書錯位的情況較多，但也存在少數(shù)錯誤檢測的情況。錯誤檢測主要存在漏檢和錯檢兩種情況，其原因在于通過手機(jī)采集的在架圖書圖像分辨率不高，如果不能正確識別出圖書的索書號，則會導(dǎo)致錯序分析失效而發(fā)生誤判。因此，本文設(shè)計的圖書錯序檢測方法的性能在一定程度上依賴于采集的書架圖像的質(zhì)量，采集的圖書圖像質(zhì)量越高，分割得到的索書號區(qū)域圖像就越清晰，索書號的識別準(zhǔn)確率就越高，發(fā)生錯判的概率就越低。

4 結(jié)語

本文提出了一種基于索書號識別的圖書串架檢測方法，該方法首先利用邊緣檢測和霍夫變換直線檢測算法獲取在架圖書書脊邊緣并分割圖書圖像，然后利用顏色直方圖特征定位并分割出圖書書脊上的索書號區(qū)域，并采用光學(xué)字符識別識別索書號。最后，通過對識別出的索書號進(jìn)行錯序分析，從而判斷書架上排放的圖書是否存在錯序情況。

盡管本文方法取得了較好的檢測效果，但仍存在不足之處，有待進(jìn)一步研究與完善，主要包括以下三個方面：（1）在架圖書圖像是由人工通過手機(jī)采集，因而圖像質(zhì)量不穩(wěn)定。在實際應(yīng)用中，可以利用安裝在云臺上的高清晰攝像頭自動采集在架圖書圖像，然后利用網(wǎng)絡(luò)傳輸?shù)接嬎銠C(jī)中進(jìn)行分析，從而使系統(tǒng)對工作環(huán)境具有更好的適應(yīng)性。（2）實驗中，采集的在架圖書擺放整齊，但實際圖書館中的圖書并不全都整齊擺放，對于存在擺放傾斜的圖書，該系統(tǒng)不能有效檢測。因此，需要進(jìn)一步完善書脊檢測算法，通過傾斜檢測與校正算法，保證檢測算法的魯棒性，從而提高系統(tǒng)的實際應(yīng)用能力。（3）對索書號進(jìn)行識別時，有些索書號出現(xiàn)誤識現(xiàn)象，其原因主要在于采集的在架圖書圖像的質(zhì)量不高。一方面，可以在采集圖像時應(yīng)利用專門的高清晰度圖像采集設(shè)備獲取高質(zhì)量圖像；另一方面，可以改進(jìn)索書號識別算法，增強(qiáng)檢測算法對低質(zhì)量圖像的識別能力。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡