賀永強(qiáng),齊 珊,李澤萌,周 盛,楊 軍,林 松
(1.中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院生物醫(yī)學(xué)工程研究所,天津 300192;2.天津邁達(dá)醫(yī)學(xué)科技股份有限公司,天津 300384;3.天津醫(yī)科大學(xué)眼科醫(yī)院,天津 300384)
高精度眼參數(shù)測(cè)量和成像技術(shù)對(duì)眼內(nèi)組織結(jié)構(gòu)生理和病理性變化的研究十分重要,譬如,眼前節(jié)參數(shù)和眼軸長(zhǎng)的變化是老視和近視發(fā)生的重要影響因素[1]。青光眼是全球不可逆性失明的主要原因,預(yù)計(jì)2040 年將有1.118 億人患有青光眼[2-3]。目前可用的治療方法無法逆轉(zhuǎn)青光眼對(duì)視覺系統(tǒng)的損害,但是早期診斷和治療可以預(yù)防疾病的進(jìn)展[4]。美國眼科學(xué)會(huì)指南和加拿大共識(shí)建議,所有青光眼疑似病例和原發(fā)性開角型青光眼患者的初始評(píng)估應(yīng)包括中央角膜厚度(central cornea thickness,CCT)測(cè)量,因?yàn)镃CT測(cè)量的結(jié)果有助于解釋眼壓測(cè)量值、風(fēng)險(xiǎn)分層和設(shè)定目標(biāo)眼壓[5]。CCT 是預(yù)測(cè)角膜屈光手術(shù)長(zhǎng)期并發(fā)癥的重要參數(shù),在角膜疾病的診斷和管理中是必不可少的[6]。前房深度(anterior chamber depth,ACD)已被確定為開角型青光眼進(jìn)展的重要危險(xiǎn)因素[7]。在超聲乳化人工晶體(intraocular corrective lens,ICL)植入術(shù)中,ACD 的測(cè)量關(guān)系到人工晶狀體度數(shù)以及術(shù)后拱高的計(jì)算,晶狀體厚度(lens thickness,LT)會(huì)影響到所需超聲劑量[8-9],睫狀溝是ICL 的固定場(chǎng)所,睫狀溝間距(sulcus to sulcus,STS)可作為ICL 的長(zhǎng)度值[10],前房角間距(angle to angle,ATA)亦影響到ICL的選擇[11]。
超聲生物顯微鏡(ultrasonic biological microscopy,UBM)穿透性強(qiáng),不受屈光介質(zhì)混濁的影響,能夠獲得相關(guān)組織結(jié)構(gòu)的精細(xì)成像,是實(shí)時(shí)觀察和精確測(cè)量眼前節(jié)及其生理參數(shù)的重要工具,但是其操作復(fù)雜、耗時(shí)長(zhǎng),且刺激性較大,容易產(chǎn)生不適感[12],需要有經(jīng)驗(yàn)的眼科醫(yī)生人工評(píng)估。臨床中需要準(zhǔn)確、實(shí)時(shí)地標(biāo)記解剖結(jié)構(gòu)和測(cè)量眼前節(jié)參數(shù),然而,由于眼部超聲儀器難以完全對(duì)準(zhǔn)眼球中線,時(shí)常會(huì)產(chǎn)生質(zhì)量不高的圖像,例如房角不清晰、晶狀體后囊與角膜偽影重合、關(guān)鍵點(diǎn)缺失、前房和晶狀體偽影、晶狀體后囊偏離瞳孔中線、未檢測(cè)到晶狀體后囊、兩側(cè)房角傾斜過大。這使得傳統(tǒng)的圖像處理技術(shù)難以適用于不同的UBM 圖像,因此基于UBM 圖像的眼前節(jié)自動(dòng)測(cè)量仍然是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。
近年來,深度學(xué)習(xí)方法發(fā)展迅速,被廣泛應(yīng)用于醫(yī)學(xué)領(lǐng)域[13-14]。大部分眼科深度學(xué)習(xí)的研究主要集中在對(duì)房角開閉的分類[15-16]。在眼前節(jié)參數(shù)估計(jì)領(lǐng)域,組織厚度和面積是量化眼科醫(yī)學(xué)圖像的常用指標(biāo),在測(cè)量指標(biāo)之前需要對(duì)組織進(jìn)行分割,角膜在光學(xué)相干斷層掃描(optical coherence tomography,OCT)圖像中的自動(dòng)分割有助于對(duì)角膜的幾何形狀進(jìn)行生物力學(xué)建模。在目前市售的OCT 設(shè)備中,CASIA 能夠成像并自動(dòng)分割眼前段[17]。Williams 等[18]使用傳統(tǒng)的圖像處理技術(shù)分割OCT 圖像中的角膜,其骰子相似系數(shù)為0.943±0.020,優(yōu)于之前發(fā)表的其他算法。OCT圖像包括角膜與虹膜區(qū)域,上述方法只提供單個(gè)區(qū)域的分割,且只能應(yīng)用于單一類型的OCT 圖像,因此Fu 等[19]用圖像特征代替臨床參數(shù),分割角膜邊界和虹膜區(qū)域以獲得前房角測(cè)量值,其研究可應(yīng)用于臨床評(píng)估和青光眼篩查。Leung 等[20]使用傳統(tǒng)的邊緣檢測(cè)算法測(cè)量前房角的尺寸及輪廓,測(cè)量的成功率為90%,部分圖片因信噪比較低不能被正確識(shí)別。Yoo 等[21]使用ResNet50 估計(jì)前房深度,以分類淺前房和深前房的圖像。Yu 等[22]使用傳統(tǒng)圖像處理算法定位房角隱窩,準(zhǔn)確率達(dá)到了95%,該算法可應(yīng)用于后續(xù)房角開閉的分類。Huang 等[23]使用Resnet-34 分級(jí)評(píng)估青光眼的視野,該算法在處理2 種視野分析儀器(Humphrey Field Analyzer 和Octopus)的數(shù)據(jù)時(shí)具有較高的準(zhǔn)確性,可應(yīng)用于遠(yuǎn)程醫(yī)療中的患者自我評(píng)估。Thompson 等[24]使用ResNet34 算法評(píng)估青光眼的結(jié)構(gòu)性損傷,該算法在檢測(cè)輕度視野缺陷的圖像方面具有較高的準(zhǔn)確性。Xu 等[25]使用ResNet-18定位眼前節(jié)光學(xué)相干斷層掃描(anterior segment optical coherence tomography,AS-OCT)圖像中的鞏膜突,其定位精度能達(dá)到人類專家級(jí)別。Wang 等[26]使用EfficientNet-B3 定位UBM 圖像中的鞏膜突,其定位性能接近專家人工定位水準(zhǔn)。
文獻(xiàn)[25]和[26]中的算法用于預(yù)測(cè)眼前節(jié)中單個(gè)關(guān)鍵點(diǎn)或單個(gè)生理參數(shù),本文在此基礎(chǔ)上,提出一個(gè)YOLOv5 算法結(jié)合先驗(yàn)知識(shí)的算法,該算法使用YOLOv5 算法定位UBM 圖像的中央角膜上皮層、中央角膜內(nèi)皮、兩側(cè)前房角、兩側(cè)睫狀溝、瞳孔兩端、瞳孔中央及晶狀體后囊,在自動(dòng)甄別出符合要求的圖像之后,根據(jù)這些點(diǎn)的像素坐標(biāo)計(jì)算CCT、ACD、STS、ATA 及瞳孔直徑(pupil diameter,PD)等眼前節(jié)生理參數(shù)的數(shù)值。本研究通過YOLOv5 算法結(jié)合先驗(yàn)知識(shí)的方法,以期快速而精準(zhǔn)地定位UBM 圖像眼前節(jié)各關(guān)鍵點(diǎn),同時(shí)精確測(cè)量UBM 圖像中的各眼前節(jié)生理參數(shù)。
目前,目標(biāo)檢測(cè)算法通常分為基于區(qū)域與基于回歸兩大類?;趨^(qū)域的算法利用2 個(gè)網(wǎng)絡(luò)分別實(shí)現(xiàn)分類與回歸,其精度較高,但是速度較低;基于回歸的算法在一個(gè)網(wǎng)絡(luò)中完成對(duì)目標(biāo)的分類與定位。這2 類方法檢測(cè)速度快,能夠滿足實(shí)時(shí)要求。本文采用的神經(jīng)網(wǎng)絡(luò)為Ultralytics LLC 公司于2020 年5 月提出的YOLOv5,屬于基于回歸的目標(biāo)檢測(cè)算法。
YOLOv5 改變了前一代YOLO 算法檢測(cè)速度快但精度不高的缺點(diǎn),提高了檢測(cè)精度和實(shí)時(shí)性能,滿足了實(shí)時(shí)圖像檢測(cè)的需要,對(duì)于多個(gè)小目標(biāo)有著較好的檢測(cè)效果。因此,本文使用YOLOv5 作為檢測(cè)算法。YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)分為輸入、主干、頸部和輸出4個(gè)部分,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
圖1 YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)
輸入包括3 個(gè)部分:馬賽克數(shù)據(jù)增強(qiáng)、自適應(yīng)錨定框和自適應(yīng)圖像縮放。YOLOv5 的輸入端使用了馬賽克數(shù)據(jù)增強(qiáng)方法,采用隨機(jī)剪裁、隨機(jī)縮放和隨機(jī)排布拼接4 張圖像,豐富了檢測(cè)數(shù)據(jù)集,提高了網(wǎng)絡(luò)的魯棒性,減少了圖形處理器(graphics processing unit,GPU)的計(jì)算量,增加了網(wǎng)絡(luò)的泛化性,適用于小目標(biāo)檢測(cè),符合本文檢測(cè)眼前節(jié)關(guān)鍵點(diǎn)的需求。
以往的YOLO 算法中需要將輸入圖像處理成固定大小,增加了許多冗余信息。YOLOv5v6.0 中使用了矩形推理,其先通過仿射變換將較長(zhǎng)邊縮放到640,由于YOLOv5 會(huì)輸出32 倍下采樣后的特征圖,因此將較短邊填充至32 的倍數(shù),再輸入算法中訓(xùn)練,過程如圖2 所示。
圖2 矩形推理以及方形推理
YOLOv5 在訓(xùn)練前會(huì)對(duì)數(shù)據(jù)集進(jìn)行回歸預(yù)測(cè),當(dāng)先驗(yàn)框?qū)?shù)據(jù)集的最佳召回率小于0.98 時(shí),使用K-means 聚類重新計(jì)算先驗(yàn)框。UBM 圖像上關(guān)鍵點(diǎn)的特征主要分布在水平方向上,錨框形狀應(yīng)為寬大于高的矩形。由于本文只需要定位錨點(diǎn),為減少錨框?qū)τ?xùn)練的影響,人為設(shè)定了錨框長(zhǎng)度。經(jīng)多次實(shí)驗(yàn),在生成數(shù)據(jù)集時(shí)將所有錨框的寬取[0.05,0.051]上的隨機(jī)數(shù),高取[0.02,0.021]上的隨機(jī)數(shù)。
在主干中,通過CSP-Darknet53 進(jìn)行特征提取,其基本模塊是CBS,與之前版本相比,將激活函數(shù)Leaky ReLU 改成了SiLU。為方便部署,YOLOv5 中將之前版本的Focus 模塊換成了6×6 的卷積層,兩者作用相同,但是后者效率更高。
在頸部中采用了特征金字塔網(wǎng)絡(luò)(feature pyramid networks,F(xiàn)PN)與路徑聚合網(wǎng)絡(luò)(path aggregation network,PAN)的結(jié)構(gòu),F(xiàn)PN 自上而下,傳遞了高層的語義特征,PAN 采用自下向上的特征金字塔,傳遞低層的定位信息,其結(jié)構(gòu)如圖3 所示。
圖3 FPN+PAN 結(jié)構(gòu)
輸出使用了非極大值抑制(non maximum suppression,NMS),在目標(biāo)檢測(cè)和預(yù)測(cè)階段,使用加權(quán)NMS 增強(qiáng)對(duì)多個(gè)目標(biāo)的識(shí)別能力,并獲得最佳的目標(biāo)檢測(cè)幀。
在使用YOLOv5 算法檢測(cè)出UBM 圖像上的眼前節(jié)各關(guān)鍵點(diǎn)后,需要對(duì)各關(guān)鍵點(diǎn)排序,以便后續(xù)眼前節(jié)參數(shù)的測(cè)量。本文根據(jù)各關(guān)鍵點(diǎn)的空間位置進(jìn)行排序,以圖片的左上角為原點(diǎn)。除前房角和睫狀溝外,其他關(guān)鍵點(diǎn)均能直接用x 坐標(biāo)或y 坐標(biāo)區(qū)分。圖4 為不同人眼的UBM 圖像,其中前房角和睫狀溝不存在x 軸或y 軸上的確切關(guān)系,故分別使用斜率k=-1 和k=1 的直線區(qū)分左側(cè)的睫狀溝和前房角以及右側(cè)的睫狀溝和前房角。當(dāng)直線過前房角時(shí),睫狀溝應(yīng)在直線下方,若設(shè)左右前房角點(diǎn)和左右睫狀溝的預(yù)測(cè)坐標(biāo)分別為(a1,b1)、(a2,b2)、(a1',b1')以及(a2',b2'),則這4 個(gè)點(diǎn)的坐標(biāo)值應(yīng)滿足a2+b2>a1+b1以及a1'+b2'>a2'+b1'。經(jīng)驗(yàn)證,這種方法能對(duì)數(shù)據(jù)集中所有UBM 圖像的標(biāo)注信息正確排序。
圖4 睫狀溝與前房角的二分類示意圖
由于UBM 圖像只有在對(duì)準(zhǔn)眼球中線時(shí)才能準(zhǔn)確反映眼前節(jié)的結(jié)構(gòu)參數(shù),本文采取神經(jīng)網(wǎng)絡(luò)和先驗(yàn)知識(shí)相結(jié)合的方法,以超聲的傳播特性及眼前節(jié)參數(shù)的參考值范圍作為判據(jù),篩除偏差較大的圖像。
角膜內(nèi)外表面、晶狀體前后表面光滑,超聲以鏡面反射為主,超聲垂直入射時(shí)反射最強(qiáng),因此在掃查切面比較正時(shí),角膜前后表面、晶狀體前后表面會(huì)形成“明亮的光帶”,并且各光帶中央大致在一條豎線上(如圖5 所示);而掃查面偏差較大時(shí),各光帶不在一條垂線上,并且晶狀體后界面通常不能顯現(xiàn)。因此,有無晶狀體后界面回聲可以作為切面是否有偏差的判斷依據(jù)之一。
圖5 UBM 圖像判斷條件示意圖
本文使用的UBM 圖像像素大小為18.18 μm×18.18 μm。為篩除切面有偏差的圖片,除UBM 圖像中應(yīng)顯示晶狀體后囊外,本文還依據(jù)眼前節(jié)參數(shù)參考值范圍設(shè)定了一些判斷條件,如圖5 所示。如兒童的PD 為4~5 mm,老年人的PD 為2~3 mm,故取2~5 mm 作為PD 的參考值范圍,將單位換算成像素后則PD∈[110,275]。由于UBM 未對(duì)準(zhǔn)眼球中心時(shí),測(cè)量出的PD 會(huì)偏小,設(shè)定此范圍可以排除部分未對(duì)準(zhǔn)眼球中心的UBM 圖像。此外,為了保證在使用UBM時(shí)超聲是垂直入射角膜的,使角膜中心、瞳孔中心以及晶狀體后囊3 個(gè)點(diǎn)在同一條直線附近,左右前房角在豎直方向上的坐標(biāo)差和左右睫狀溝在豎直方向上的坐標(biāo)差須小于1 mm,晶狀體后囊與瞳孔中心的水平坐標(biāo)之差須小于1.1 mm。
本文使用PyTorch 1.9.0 框架,硬件環(huán)境為NVIDIA RTX3090,內(nèi)存為24 GiB,計(jì)算架構(gòu)為CUDA 11.1,編譯語言為Python 3.8。
本文使用的數(shù)據(jù)集為天津醫(yī)科大學(xué)眼科醫(yī)院從2019 年4 月11 日至2020 年9 月18 日采集的眼科疾病患者的前房角UBM 圖像。本研究由天津醫(yī)科大學(xué)眼科醫(yī)院倫理委員會(huì)批準(zhǔn)(2019KY-24)。UBM 設(shè)備為天津邁達(dá)醫(yī)學(xué)科技股份有限公司生產(chǎn)的MD-300L,所用超聲探頭頻率為50 MHz,圖像分辨力為1024 px×576 px。本次實(shí)驗(yàn)共選用前房角UBM 圖像樣本717 幅,按照592∶125 的比例分為訓(xùn)練集和測(cè)試集,其中包含檢測(cè)到晶狀體后囊的圖像以及未檢測(cè)到晶狀體后囊的圖像。
由經(jīng)驗(yàn)豐富的臨床醫(yī)生使用labelme 圖像標(biāo)注工具手動(dòng)標(biāo)記中央角膜上皮層、中央角膜內(nèi)皮、兩側(cè)前房角、兩側(cè)睫狀溝、瞳孔兩端、瞳孔中央及晶狀體后囊,如圖6 所示,對(duì)于未檢測(cè)到晶狀體后囊的圖像則不標(biāo)注晶狀體后囊,以這些標(biāo)注作為金標(biāo)準(zhǔn)。為滿足YOLOv5 數(shù)據(jù)集的要求,將標(biāo)注所得的各點(diǎn)的橫、縱坐標(biāo)分別除以分辨力的寬和高后,得到歸一化后的錨點(diǎn)坐標(biāo)。
圖6 UBM 圖像眼前節(jié)關(guān)鍵點(diǎn)標(biāo)注示意圖(金標(biāo)準(zhǔn))
本文使用二維空間的歐氏距離的平均值評(píng)估算法對(duì)每個(gè)點(diǎn)的定位性能,計(jì)算公式如下:
式中,ρ^為歐氏距離的平均值;(x,y)、(x',y')分別為某點(diǎn)的真實(shí)坐標(biāo)和預(yù)測(cè)坐標(biāo);S 為點(diǎn)的個(gè)數(shù)。同樣的,本文使用歐氏距離之差的絕對(duì)值評(píng)估算法對(duì)生理參數(shù)的測(cè)量誤差,計(jì)算公式如下:
在篩除切面有偏差的圖像時(shí),需要篩除沒有晶狀體后囊的UBM 圖像,此時(shí)算法可能在本不包含晶狀體后囊的UBM 圖像中將角膜的偽影視為晶狀體后囊,導(dǎo)致后續(xù)測(cè)量的晶狀體厚度不準(zhǔn)確。本文使用假陽性率表示這種情況發(fā)生的概率,計(jì)算公式如下:
式中,F(xiàn)PR 為假陽性率,TP 為真正例,F(xiàn)P 為假正例。
參數(shù)訓(xùn)練采用Adam 優(yōu)化算法,參數(shù)設(shè)置如下:輸入圖像尺寸為640 px×384 px,批量大小為16,最大迭代次數(shù)為500,動(dòng)量因子為0.93334,權(quán)重衰減系數(shù)為0.00043,初始學(xué)習(xí)率為0.00693,余弦退火超參數(shù)為0.1,采用距離交并比(distance intersection over union,DIoU)作為損失函數(shù)。
訓(xùn)練初期模型的權(quán)重是隨機(jī)初始化的,較大的學(xué)習(xí)率可能帶來模型的不穩(wěn)定,如圖7(a)所示。本文采用預(yù)熱加余弦退火的方式動(dòng)態(tài)調(diào)整學(xué)習(xí)率,如圖7(b)所示。預(yù)熱使模型先使用較小的學(xué)習(xí)率訓(xùn)練,當(dāng)模型趨于穩(wěn)定后,再使用較大的學(xué)習(xí)率進(jìn)行訓(xùn)練,使模型跳出局部極小值。當(dāng)參數(shù)接近全局最小值時(shí),通過余弦退火降低學(xué)習(xí)率,使得損失函數(shù)逼近全局最優(yōu)解[27]。
圖7 訓(xùn)練過程圖及學(xué)習(xí)率變化圖
在預(yù)訓(xùn)練中進(jìn)行了對(duì)照實(shí)驗(yàn),結(jié)果見表1。YOLOv5s 的訓(xùn)練結(jié)果優(yōu)于模型尺寸更大的YOLOv5m。其原因可能是大模型在訓(xùn)練時(shí)產(chǎn)生了過擬合,且前者的速度是后者的2.7 倍,更符合本文實(shí)時(shí)檢測(cè)的要求。故以下實(shí)驗(yàn)均在YOLOv5s 的基礎(chǔ)上開展。
表1 YOLOv5m 與YOLOv5s 的性能比較
超參數(shù)初始值將影響到模型的最終性能,而YOLOv5 的超參數(shù)初始值是從常見目標(biāo)檢測(cè)(common objects in context,COCO)數(shù)據(jù)集上使用遺傳算法得到的。因?yàn)轭A(yù)訓(xùn)練時(shí)模型在第200 個(gè)迭代周期處收斂,故在默認(rèn)超參數(shù)的基礎(chǔ)上運(yùn)行150 次200 個(gè)迭代周期,得到適合UBM 圖像的超參數(shù)。實(shí)驗(yàn)結(jié)果表明,通過遺傳算法優(yōu)化超參數(shù)初始值能夠提高模型的定位性能。
卷積神經(jīng)網(wǎng)絡(luò)需要大量帶標(biāo)簽的數(shù)據(jù),但在醫(yī)學(xué)領(lǐng)域獲取大量帶標(biāo)注的圖像較困難,標(biāo)注成本較高,因此本文采用遷移學(xué)習(xí)[28],使用COCO 和視覺目標(biāo)分類(visual object classes,VOC)數(shù)據(jù)集上的訓(xùn)練結(jié)果初始化YOLOv5 的網(wǎng)絡(luò)參數(shù)。對(duì)比從頭訓(xùn)練與凍結(jié)網(wǎng)絡(luò)前10 層的訓(xùn)練結(jié)果,雖然凍結(jié)部分網(wǎng)絡(luò)能夠加速模型訓(xùn)練,但同時(shí)也降低了模型精度,這可能是因?yàn)镃OCO 數(shù)據(jù)集的模型權(quán)重不適用于UBM 圖像。
表2 中展示了主要的實(shí)驗(yàn)結(jié)果。第1 行作為對(duì)照組。在第2 行中,使用遺傳算法尋找較優(yōu)超參數(shù),模型的精度稍有提高。在第3 行中,訓(xùn)練時(shí)凍結(jié)部分網(wǎng)絡(luò),該方法加快了訓(xùn)練速度,但會(huì)降低精度,適合算力不足的場(chǎng)合。為驗(yàn)證本模型能夠適應(yīng)任意尺寸的UBM 圖像,在第4 行,將測(cè)試集中的UBM 圖像尺寸放大2 倍,此時(shí)模型的推理速度不變,精度得到了微小的提升。在第5 行中,采用了推理增強(qiáng)和NMS增強(qiáng),使用后模型精度稍有提高,但是速度較慢,不符合本文實(shí)時(shí)性的要求。
權(quán)衡速度與性能,最優(yōu)的方案是使用YOLOv5s模型,并使用遺傳算法在本文使用的數(shù)據(jù)集上尋找合適的超參數(shù)初始值,此時(shí)YOLOv5 模型點(diǎn)定位的平均誤差為(66.27±66.25)μm,平均像素誤差為(3.65±3.64)px,文獻(xiàn)[25]中ResNet-18 模型點(diǎn)定位的平均像素誤差為(9.14±5.21)px,文獻(xiàn)[26]中EfficientNet-B3模型點(diǎn)定位的平均像素誤差為(6.31±5.12)px。由于2 個(gè)文獻(xiàn)所用的UBM 圖像分辨力不同,故使用平均像素誤差比較其定位性能,在定位眼前節(jié)關(guān)鍵點(diǎn)的任務(wù)上,YOLOv5 算法精度較高。本算法預(yù)測(cè)ATA 的相對(duì)誤差約為2.05%,預(yù)測(cè)PD 的相對(duì)誤差為2.65%,預(yù)測(cè)STS 的相對(duì)誤差為1.76%,預(yù)測(cè)CCT 的相對(duì)誤差為9.61%,預(yù)測(cè)ACD 的相對(duì)誤差為1.98%,預(yù)測(cè)LT的相對(duì)誤差為1.32%。
針對(duì)已有算法無法在UBM 圖像中同時(shí)測(cè)量多個(gè)眼前節(jié)生理參數(shù)的問題,本文提出了一種YOLOv5算法結(jié)合先驗(yàn)知識(shí)的檢測(cè)方法,通過遷移學(xué)習(xí)提高了模型的泛化性能,并使用遺傳算法優(yōu)化模型初始超參數(shù),相比于其他眼前節(jié)圖像關(guān)鍵點(diǎn)定位的深度學(xué)習(xí)方法,本文算法對(duì)點(diǎn)定位的像素誤差更小,并能夠精確且快速地測(cè)量多個(gè)眼前節(jié)生理參數(shù)。
實(shí)驗(yàn)結(jié)果中對(duì)CCT 的測(cè)量誤差較大,這是由于CCT 本身值較小,相對(duì)誤差偏大,另外其他生理參數(shù)測(cè)量的相對(duì)誤差均在3%以下,算法的總體精度能夠達(dá)到要求。算法在配備Ryzen 54600U 處理器的便攜式計(jì)算機(jī)上檢測(cè)一張UBM 圖片的時(shí)間為140 ms,說明該算法對(duì)硬件要求不高,能夠滿足實(shí)時(shí)性的要求。此外,本文的算法能夠直接檢測(cè)不同尺寸及分辨力的UBM 圖像,故能應(yīng)用于不同型號(hào)的UBM 儀器。
但本研究仍然有很多不足,首先是缺少絕對(duì)正確的標(biāo)注,由于金標(biāo)準(zhǔn)是由臨床醫(yī)生人工標(biāo)注的,在此過程中可能會(huì)人為地引入誤差,當(dāng)訓(xùn)練集的標(biāo)注存在錯(cuò)誤時(shí),模型會(huì)從這些錯(cuò)誤中學(xué)習(xí)規(guī)律。有一些研究表明,參與標(biāo)注的專家越多時(shí),標(biāo)注的客觀性越強(qiáng),此時(shí)誤差將趨近于零[29]。其次,由于數(shù)據(jù)集均來自于同一個(gè)醫(yī)院,在缺乏其他數(shù)據(jù)集驗(yàn)證的情況下,該算法可能無法在其他地區(qū)取得很好的效果。最后,結(jié)果中FPR 為4.55%,算法不能完全篩除不包含晶狀體后囊的圖片,這會(huì)使掃查切面不正的UBM 圖像亦顯示出測(cè)量結(jié)果,后續(xù)研究可以通過增加篩除條件降低FPR。
綜上所述,本文提出了一種基于YOLOv5 的UBM圖像眼前節(jié)參數(shù)實(shí)時(shí)檢測(cè)算法,該方法經(jīng)實(shí)驗(yàn)測(cè)試,準(zhǔn)確率高且能達(dá)到視頻圖像實(shí)時(shí)性要求。在未來,需要更多的研究來評(píng)估該算法的臨床性能,并通過擴(kuò)大數(shù)據(jù)集等方式提高其泛化能力。