申 宇, 楊妍雯, 陳佳珍, 郭子翊, 鄒奉元
(浙江理工大學 a.絲綢文化傳承與產品設計數字化技術文化和旅游部重點實驗室; b.浙江省服裝工程技術中心;c.服裝數字化技術浙江省工程實驗室,杭州 310018)
COVID-19新冠病毒的暴發(fā)使口罩成為醫(yī)護人員和普通人群的重要防護設備,如何提高口罩的貼合性與舒適性成為人們關注的社會熱點問題,并且隨著生活水平的提高人們的頭面部形態(tài)發(fā)生變化,20年前的國家標準已不再適應如今頭面部產品的適配設計[1]。因此,人體頭面部數據特征提取及形態(tài)有效細分來滿足口罩、頭盔、面具等頭面部服飾產品在人體適配設計過程中的需求成為迫切需要。
人體頭面部特征及分類研究是口罩、面具與頭盔等頭面部產品結構設計、號型制定、舒適合體性研究及版型優(yōu)化的重要基礎[2]。李詠蘭[3]以來自36個不同區(qū)域的8 174名成年男性為研究對象,并提取其12項頭面部形態(tài)學指標,對漢族男性的頭面部特征進行研究與分類。宇克莉等[4]以182名夏爾巴成人為研究對象,統(tǒng)計分析了西藏地區(qū)成人的頭面部及體部指標,豐富了民族體質數據資料庫。杜抱樸等[5]以134名成年人為實驗對象,通過其14項頭面部測量指標分析它們與8項地理環(huán)境因素間的線性關系。李欣等[6]對新疆不同地區(qū)柯爾克孜族成人的上眼瞼皺褶、顴部突出度、蒙古褶等20項頭面部指標進行觀察記錄,并比較他們的頭面部特征差異,為體質人類學的研究積累資料。綜上可以看出,近年來的研究主要集中在民族與地區(qū)對頭面部形態(tài)造成的影響及各細部特征之間的差異,對數據庫中包含大量樣本的頭型數據缺少有效分析,使得在進行頭面部產品設計時沒有反映群體的有效特征,并且在進行形態(tài)分類時缺乏準確有效的模型。多層感知器(Multilayer Perceptron,MLP)神經網絡是一種人工神經網絡(Artificial Neural Network,ANN)算法,隨著神經網絡技術的發(fā)展逐漸被應用于預測分類等方面[7],該模型具有很強的非線性逼近功能,結構簡單,輸入變量數目可控,操作性強,可以很好地應用在人體號型分類與預測研究中[8]。
本文為提高頭面部產品適配性,以189名18~26歲在校女大學生為研究對象,通過主成分分析(Principal Component Analysis,PCA)提取影響頭面部形態(tài)的特征因子;采用K-means方法對頭面部形態(tài)進行分類,利用指數分型法把頭面部形態(tài)進行量化分型,并提出基于MLP神經網絡的頭面部號型預測模型;可大幅提高由于頭面部尺寸過于繁雜,在進行號型分類或選擇時參考依據過多而產生的生產工作效率低等問題,為研究當代中國人的頭面部尺寸和面向中國市場的口罩、面具等頭面部產品設計積累形態(tài)學資料。
不同地區(qū)、不同年齡的人體頭面部形態(tài)、尺寸具有較大差異。為保證樣本的代表性與獨立性,本文以18~26歲女大學生作為測量樣本,該年齡段女性的頭面部已基本發(fā)育完全,能充分體現頭面部形態(tài)特征。根據國際標準ISO 15535—2012《Standard of International Organization for Standardization》中規(guī)定建立人體測量數據樣本量的計算方法來確定測量樣本,如下式所示:
(1)
式中:n為估計樣本量;σ為標準差;Δ為允許誤差。
以頭全高指標的σ=1.406 5為計算值,由式(1)計算得到估計樣本量n=135,同時考慮到異常值和無效樣本,確定本實驗樣本量為189人。并通過分組隨機抽樣法,將18~26歲女大學生分為三組,即18~20歲、21~23歲、24~26歲,在每組中抽取63名女大學生作為測量樣本。
根據GB/T 2428—1998《成年人頭面部尺寸》中女子頭面部項目尺寸規(guī)定的41個測量項目及實驗對象的身高、體重,對女大學生的頭面部尺寸進行測量和特征提取。頭面部測點如圖1所示,頭面部測量項目如圖2所示。
al:鼻翼點;ch:口角點;en:眼內角點;eu:頭側點;tr:發(fā)緣點;ft:顳嵴點;g:眉間點;gn:頦下點;go:下頜角點;li:下唇中點;ls:上唇中點;n:鼻根點;obi:耳下附著點;obs:耳上附著點;pu:瞳孔;pra:耳前點;se:鼻梁點;sa:耳上點;sba:耳下點;sto:口裂點;v:頭頂點;zy:顴點;ex:眼外角點;l:枕外隆突點;sn:鼻下點;op:枕后點;pa:耳后點;prn:鼻尖點;t:耳屏點
1:頭圍;2:形態(tài)面長;3:頭最大長;4:頭最大寬;5:頭矢狀弧;6:頭冠狀弧;7:頭全高;8:鼻尖點至枕后點距;9:耳屏至枕后點距;10:頭斜長;11:兩耳外寬;12:兩耳屏間寬;13:額最小寬;14:面寬;15:兩下頜角間寬;16:容貌面長I;17:容貌上面長;18:鼻高;19:鼻寬;20:鼻深;21:鼻下頦下點距;22:兩眼外寬;23:瞳孔間距;24:兩眼內寬;25:口寬;26:唇全高;27:耳基部長;28:容貌耳寬;29:耳屏顴點長;30:耳屏鼻根長;31:耳屏頦下長;32:耳屏下頜角長;33:耳屏點間額弧長;34:耳屏點間頦下弧長;35:耳屏點間頜下弧長;36:頭頂:枕后點間頦下圍長;37:頭耳高;38:容貌耳長;39:頭頂點至眉間點距;40:頭頂點至鼻尖點距;41:耳屏耳上點高
采用DP-LI馬丁測量儀(北京亞歐德鵬公司),主要包括滑動計(測量范圍0~200 mm/mm,精度±0.1 cm)、直尺(測量范圍0~150 mm/mm,精度±0.1 cm)、鋼卷尺(測量范圍0~2 000 mm/mm,精度±0.1 cm)、觸角計(測量范圍0~450 mm/mm,精度±0.1 cm),以及軟卷尺進行接觸式測量,測量實驗對象的頭面部尺寸。使用SH200G身高體重計(杭州上禾科技公司),身高測量范圍5~200 cm,測量精度±0.1 cm,體重測量范圍5~165 kg,測量精度±0.1 kg,測量實驗對象的身高與體重。
手工接觸式測量要點:要求實驗對象在測量之前平靜3 min,并保持直立平視前方,按GB/T 2428—1998中女子頭面部項目尺寸規(guī)定的41個測量項目在實驗對象頭面部標出測量點位置,進行3次測量計算并記錄平均值,且要求3次測量結果誤差在±0.1%之內,若超過則重新測量。
2.1.1 聚類變量選取
為綜合41個頭面部測量參數對頭部進行分類,本文采用線性主成分分析(PCA)的方法對需要分析的頭面部尺寸進行降維。PCA的降維處理是通過將數據嵌入到原始空間的低維子空間中來實現的,通過PCA提取了7個頭面部特征主成分,前7個主成分的特征根均大于1且累計方差貢獻率為82.459%。因此選擇前7個主成分分析頭面部特征,分析效果較為理想,因子分析如圖3所示。
圖3 因子分析結果
因子載荷矩陣旋轉后的結果如表1所示。由表1可知,主成分因子1在頭圍、頭最大長等表征頭部輪廓變量上有較大載荷,定義為頭部輪廓因子;主成分因子2在耳部變量上載荷系數較大,定義為耳部因子;主成分因子3在形態(tài)面長等表征上面部形態(tài)的變量上載荷系數較大,定義為形態(tài)上面部因子;主成分因子4在兩下頜角間寬等表征下面部形態(tài)的變量上載荷系數較大,定義為形態(tài)下面部因子;主成分因子5在兩眼內寬、兩眼外寬變量上載荷較大,定義為眼部因子;主成分因子6在鼻高、鼻深、鼻寬等變量上有一定載荷,定義為鼻部因子;主成分因子7在大口寬和唇全高變量上載荷較大,定義為口唇部因子。因此,確定頭面部形態(tài)的因子為頭部輪廓因子、耳部因子、形態(tài)上面部因子、形態(tài)下面部因子、眼部因子、鼻部因子和口唇部因子。
表1 因子載荷矩陣
采用相關指數最大值法從提取的7個因子中選取相關指數最高的指標作為進行聚類分析時所需要的代表性指標,如下式所示[9]。
(2)
式中:Rj為變量j的相關指數;rij為相關系數;j=1,2,…,m;i=1,2,…,m;m為所在因子的指標數量。
根據式(2)可以計算得出同類主成分中每個指標的相關指數,結果如表2所示,代表性聚類指標即為各主成分中相關指數最高的指標。根據表2所示,同時結合頭面部產品的實際開發(fā)生產需求選取各主成分中相關指數最大的頭圍、容貌耳長、形態(tài)面長、容貌面長Ⅰ、兩眼外寬、鼻高及口寬作為代表性指標進行頭面部形態(tài)聚類分析。
表2 各類因子的相關指數
2.1.2 最佳分類數的確定
通過混合F統(tǒng)計量(FMixed)來確定聚類的最佳分類數[10],計算方法如下式所示。FMixed越大表示類內聯(lián)系越緊密且類間聯(lián)系越分散,因此FMixed最大時其c值就是最佳分類數。
(3)
式中:P為聚類的變量數;F(k)為第k個聚類變量的F值,可由下式得到。
(4)
式中:c為聚類數;n為總樣本數;ni為第i類樣本數;vik為第i類樣本第k個變量的聚類中心,k=1,2,…,p;vk為第k個變量聚類中心的平均值;xijk為第i類的第j個樣本的第k個變量值。
由圖4可知,當FMixed值最大時c=5,類內聯(lián)系最緊密,即189名女大學生頭面部最佳分類為5類?;贙-means聚類方法對頭面部進行分類獲得初始分類結果,然后經過9次迭代使聚類中心收斂獲得最終聚類結果。
圖4 不同分類數對應的Fmixed值
2.1.3 頭面部號型歸檔
根據K-means結果將頭面部形態(tài)進行號型分檔,方便為后續(xù)使用MPL神經網絡實現通過少量頭面部特征尺寸精準預測其號型分類,本文依據各類別聚類中心值采用指數分型法把頭面部進行量化分型。其中,形態(tài)指數=形態(tài)面高/面寬×100[11],將頭面部分為5個號型(表3):第一類橫向維度最小,形態(tài)指數>93,為XS型;第二類橫向維度最寬,形態(tài)指數≤79,為XL型;第三類橫向維度處于中等水平,形態(tài)指數∈(84,88],為M型;第四類橫向維度較小,形態(tài)指數∈(88,93],為S型;第五類橫向維度較寬,形態(tài)指數∈(79,84],為L型。
表3 頭面部號型分檔
覆蓋率是不同被測人員的頭面部號型占據的比例,本文按照覆蓋率≥5%設置,若<5%則不設置號型。如表3所示,將頭面部號型劃分成5個號型:XS型覆蓋率為12%、S型覆蓋率為19%、M型覆蓋率為37%、L型/覆蓋率為26%、XL型覆蓋率為6%,其中形態(tài)指數均值為85.6,M號型分布最廣,可作為中間號型。
2.2.1 MLP神經網絡模型設計
多層感知器(MLP)每層的神經元均相互連接,包含輸入層、輸出層及隱藏層,隱藏層既可為1層也可為多層[12]。本文使用的MLP模型只含一個隱層,其結構如下式所示。
f(x)=G(b(2)+W(2)(s(b(1)+W(1)x)))
(5)
式中:函數G是softmax,W表示偏重,b為偏置。
該模型主要是通過頭圍、容貌耳長、形態(tài)面長、容貌面長Ⅰ、兩眼外寬、鼻高、口寬對頭面部號型進行預測,使用R語言中的Sample()函數對樣本進行編碼;并從數據集中使用train <- sample(nrow(df),0.7*nrow(df))抽取各個號型的70%作為訓練樣本,即133個樣本數據,用于對神經網絡的訓練,直到訓練出較好的模型;再用剩余的56個樣本數據對訓練好的神經網絡的性能進行測試。輸入層有7個神經元分別為頭圍、容貌耳長、形態(tài)面長、容貌面長Ⅰ、兩眼外寬、鼻高、口寬。MLP神經網絡模型設計步驟如下:
1) 導入必要的python模塊,主要包含numpy、theano及其自帶的os、sy等模塊。
2) 定義MLP模型,基本“構件”包括HiddenLayer和Logistic Regression兩個主體部分。除此之外,還需要定義隱含層的連接系數W、偏置b及輸入和輸出,并使用梯度下降法確定求解最佳的參數解決最優(yōu)化問題。完成后將它們“組裝”在一起,如圖5所示是MLP的基本結構。
圖5 MLP模型結構
3) 將MLP應用于MNIST,即定義MLP模型后將其應用于MNIST數據集。需要定義mnist.pkl.gz的函數load_data()等數據,加載數據完成后可以進行訓練,并設置batch_size為10,即每訓練完10個樣本后重新計算梯度與參數,完成更新,并使用梯度下降法來優(yōu)化MLP模型。
2.2.2 預測結果分析
在實驗MLP時,網絡信息參數如表4所示,使用神經網絡函式庫Keras進行訓練。輸入層有7個因子分別為頭圍、容貌耳長、形態(tài)面長、容貌面長Ⅰ、鼻高、口寬、兩眼外寬,協(xié)變量為身高與體重,隱藏層單位數為11,采用tanh激勵函數,同時為了防止過擬合還需要在每個隱藏層后輸入dropout的值。輸出層為1個神經元的全連接層,采用Softmax激勵函數,單位數5分別為五種號型歸檔XSSMLXL,并且在訓練過程中使用具有自適應學習速率的梯度下降算法進行優(yōu)化,模型結構如圖5所示。
表4 網絡信息參數
預測擬概率如圖6所示,五種號型預測正確率分別為90.0%、92.2%、93.7%、96.2%、94.8%。模型號型預測ROC如圖7所示,曲線下范圍越接近于1說明驗證的準確性越高。由圖7可知,號型XS的曲線范圍為0.998,號型S的曲線范圍為0.992,號型M的曲線范圍為0.998,號型L的曲線范圍為0.997,號型XL的曲線范圍為0.999,說明該模型的預測效益良好。
圖6 預測擬概率
圖7 ROC曲線
模型累計增益效果如圖8所示,表5為模型的預測結果。由表5可知,MLP以各號型樣本量的70.00%進行訓練,在訓練時的各號型平均正確百分比為98.62%,在測試時的各號型平均正確百分比為93.42%。
圖8 累計增益效果
表5 模型預測結果
綜上所述,MLP神經網絡的預測模型預測精度達到93.42%,預測效果較好,可以滿足頭面部產品的設計、生產的需要。該模型結構簡單,且當訓練樣本數據足夠多時該模型則具有更強的非線性逼近功能,可應用于頭面部號型更廣泛的預測與分類,操作性強。
本文為提高頭面部產品的適配性,運用馬丁測量儀等對189名18~26歲在校女大學生進行頭面部測量,通過因子分析提取了影響頭面部形態(tài)的特征因子,采用K-means聚類對頭面部形態(tài)分類,利用指數分型法把頭面部進行量化分型,并提出基于MLP神經網絡頭面部號型預測模型。
1) 通過對189名實驗對象的頭面部特征進行分析,提取影響頭面部形態(tài)的7個重要特征因子:頭部輪廓因子、耳部因子,形態(tài)上面部因子、形態(tài)下面部因子、眼部因子、鼻部因子和口唇部因子。
2) 通過形態(tài)指數并且依據各類別聚類中心值把頭面部進行量化分型,將頭面部分為5個號型:XS型/形態(tài)指數>93、S型/形態(tài)指數∈(88,93]、M型/形態(tài)指數∈(84,88]、L型/形態(tài)指數∈(79,84]、XL型/形態(tài)指數≤79,并且將M型作為中間號型。
3) 通過MLP神經網絡實現通過少量頭面部特征尺寸精準預測其號型分類,生成的模型預測結果正確率達到93.42%,大幅提高了由于頭面部尺寸過于繁雜、在進行號型分類或選擇時參考依據過多而產生的生產工作效率低等問題。
本文為頭面部特征研究提供了一種客觀方法,但仍存在一定的局限性,可通過擴大實驗對象的地域、年齡等進行比較研究,不斷完善頭面部形態(tài)分類并將其應用于頭面部產品規(guī)格體系,可為研究當代中國人的頭面部特征和面向中國市場的口罩、面具等頭面部產品設計積累形態(tài)學資料。
《絲綢》官網下載
中國知網下載