国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

具有網(wǎng)絡一致結構的三維人臉模型重建研究

2020-12-01 03:15:00劉政董洪偉楊振
軟件導刊 2020年10期

劉政 董洪偉 楊振

摘 要:針對傳統(tǒng)方法及機器學習方法對大量三維人臉數(shù)據(jù)、訓練樣本數(shù)量與質量依賴性大的問題,采用基于光照立體的方法,利用人臉圖像重建三維人臉。綜合利用基于法線的模型變形法和非剛性變形法,提出一種基于法線的非剛性變形算法。利用SFS算法計算頂點法線,然后使用法線和局部剛性約束使參考模型變形,進而得到與參考模型具有一致網(wǎng)絡結構的三維人臉模型,從而得到三維人臉圖像。該方法與傳統(tǒng)方法相比,節(jié)省了大量樣本要求,并且立體效果更好。

關鍵詞:SFS; 三維人臉; 非剛性網(wǎng)格變形

DOI:10. 11907/rjdk. 201042

中圖分類號:TP317.4 文獻標識碼:A 文章編號:1672-7800(2020)010-0156-04

Abstract: Aiming at the problem that traditional methods and machine learning methods depend on a large number of 3D face data, the number and quality of training samples, this paper uses the method based on lighting stereo to realize the reconstruction of a three-dimensional face from a face image. A non-rigid model deformation algorithm based on normal is proposed, which combines a normal based deformation algorithm and a non-rigid model deformation algorithm. The SFS is used to estimate the normal of the vertices, then updated normal are used to deform the reference face model with local rigid constrain, finally a deformed 3D face model is obtained, which has the same mesh structure with the reference model, thereby obtaining a 3D face image. Compared with the traditional method, the proposed method can save a lot of sample requirementsand the stereo effect is better.

Key Words: SFS; 3D face; non-rigid mesh deformation

0 引言

三維人臉重建是計算機圖形學的研究熱點。目前三維人臉重建方法可大致分為基于儀器掃描的方法和基于圖像的重建方法。使用儀器掃描雖然可以獲得較高質量的三維人臉模型,但被掃描對象需與掃描儀器進行交互,且掃描期間目標對象需盡可能保持靜止;通過掃描設備掃描得到三維人臉模型后,還需對掃描數(shù)據(jù)進行一系列復雜的處理才能得到較高質量的三維人臉模型。另外掃描設備價格高、操作較復雜性,使該方法難以普及?;趫D像的重建方法包括基于統(tǒng)計模型的三維人臉重建[1-4]、基于多視幾何的三維人臉重建[5]、 基于光照立體的三維人臉重建[6-11]以及近年來發(fā)展迅速的基于機器學習的三維人臉重建[12-14]。

基于統(tǒng)計模型的三維人臉重建方法依賴于大量的三維人臉數(shù)據(jù),這些數(shù)據(jù)一般是對掃描得到的人臉模型進行PCA(Principal Components Analysis)處理后獲得的。另外,該方法重建結果嚴重依賴于數(shù)據(jù)庫中的人臉模型,數(shù)據(jù)庫中模型空間有限,限制了重建靈活性。傳統(tǒng)基于多視幾何的方法需獲取不同角度的多張正交人臉圖像,為計算圖像匹配點,首先需足夠多的匹配點數(shù)量,然后匹配精確度也要求很高。而基于機器學習的方法則需要大量三維人臉數(shù)據(jù)用以訓練,其最終重建結果同樣依賴于訓練樣本數(shù)量,與基于統(tǒng)計模型的方法有相同的弊端。 本文采用基于光照立體的方法,利用人臉圖像實現(xiàn)三維人臉重建。

Woodham[6]在1980年首次利用光度立體(Photometric Stereo,PS)重建三維模型,PS理論依據(jù)是物體表面反射光強度及物體表面與光的夾角及觀察位置相關,利用不小于3張視角固定且光照不同的圖像恢復形狀和反射率[7]。從陰影恢復形狀法(Shape-from-shading,SFS)是PS的特例。Horn[8]在1989年提出SFS與傳統(tǒng)PS的區(qū)別是它可從一張圖像上重建三維模型。

傳統(tǒng)SFS需要已知目標表面反射率屬性和光照條件以及邊界值,然而這些條件并不容易獲得。為了避免這些苛刻的條件,Ira[15]基于不同的人臉模型在尺寸、長寬比及鼻子、眼睛等主要特征位置是相似的特點,并且假設人臉模型滿足朗伯反射,通過引入一個參考人臉模型,將問題轉化為求解圖像輻照度方程的問題,利用球諧函數(shù)先計算光照強度,再計算每個像素點深度值;Nehab[16]提出一種基于法線的三維模型變形方法;Yang[17]將Nehab的模型應用于三維人臉重建,從多張圖像重建三維人臉,與文獻[15]直接計算像素點深度值這種2.5D的方法不同,Yang首先利用圖像更新參考模型中頂點的法線,進而利用法線使參考模型變形;文獻[18]在此基礎上增加了法線可信度,即,對每張圖像計算出的法線計算加權和,法線權值大小與法線和相機方向的夾角成正比;文獻[19]同樣使用法線優(yōu)化三維人臉模型。但是文獻[19]理論上至少需要4張圖像,該方法利用了SVD建立圖像與球協(xié)函數(shù)的聯(lián)系,但是由于人臉是非剛性的,不同圖像中的人臉會有表情差異, 這會影響SVD結果。本文亦是利用法線使初始模型變形,但與文獻[18]、[19]不同的是,本文利用局部剛性約束,最終變形后的人臉模型與初始人臉模型具有一致的網(wǎng)絡結構,如圖1所示。

1 算法概述

本文算法主要包括兩部分:第一部分是更新模型中頂點的法線,即利用輸入的人臉圖像和輻照度方程計算初始模型中頂點法線;第二部分是利用法線使初始模型變形,進而得到與目標圖像相似的三維人臉模型。

3DMM是一種基于統(tǒng)計的從圖像重建三維人臉方法,雖然該方法重建的三維人臉模型受其數(shù)據(jù)庫中人臉模型空間約束,難以實現(xiàn)高質量的三維人臉重建,但其輸出模型結構一致性使該方法擬合的三維人臉模型可作為初始模型,進而使用其它優(yōu)化方法進一步處理。故本文先使用文獻[3]中3DMM方法,用一張人臉圖像生成1個初始三維人臉模型,然后計算每張圖像到初始模型的相機參數(shù)。利用相機參數(shù),可獲取初始模型在每張圖像視角下的可見頂點,將這些可見頂點投影到對應的人臉圖像上可獲得頂點在圖像上的顏色信息,之后利用SFS技術更新每個頂點法線,進而更新三維人臉模型。本文算法流程如圖2所示。

2 法線計算

首先使用文獻[3]中的形變模型方法擬合一個初始三維人臉模型,然后利用文獻[21]的特征點檢測法,標記出人臉圖像中的特征點,利用圖像上的特征點以及初始三維人臉模型上與之對應的特征點,計算模型到圖像的相機參數(shù),與文獻[3]相同,相機參數(shù)采用弱透視投影。

利用相機參數(shù),可以獲得初始三維人臉模型在每個圖像視角下的可見頂點及可見頂點的顏色信息。與文獻[18]相同,使用球諧函數(shù),基于每個頂點的顏色信息即可更新頂點法線。

文獻[18]使用一個參考模型將問題轉化為求解圖像輻照度方程[I=ρln]的問題, 進一步利用球諧函數(shù)將其表示為:

其中,[ρ]是物體表面反射率,[l]是光照系數(shù),[n=(nx,ny,nz)]是物體表面頂點的法線,[Y(n)]是球諧基, 給出其前9項。

與文獻[11]相同,本文省略其中的常數(shù)項,將常數(shù)項歸入光照系數(shù)中。已有分析表明,一階諧波近似 (球協(xié)基中的前4項) 至少可捕捉87.5%的圖像信息,而實際使用時只考慮模型中面對相機的部分,因此實際精度接近95%;二階諧波近似 (球協(xié)基中的9項) 至少可以捕獲99.2%的信息[11]。因此為了便于求解,本文只使用球諧函數(shù)的第一階近似,既只使用[Y(n)]的前4項,使問題線性化。

由于公式(1)中[l]和[ρ]也是未知量,欲求[n]首先需計算出[l]、[ρ]。文獻[19]提到人臉上的局部陰影會影響光照系數(shù)和反射率精確度。因此為增加魯棒性將式(2)改寫為:

其中,[m]指第[m]張圖像,[lm]是圖像[m]的光照系數(shù),[ρm,i]是頂點[i]在對應于圖像[m]的反射率,[dm,i]是頂點[i]對應于圖像[m]的反射率補償值,[vi]表示模型上第[i]個頂點,[Sm]表示參考模型在圖像[m]視角下的所有可見點,[nm,i]表示模型中頂點[i]在圖像[m]視角下的法線,[cm,i]表示頂點[i]在圖像[m]上的顏色,[Vi,ring]表示頂點[i]的相鄰點,[α]是反射率補償值平滑約束的權重。

基于公式(3)可以首先令圖像[m]視角下所有[ρm,i]等于該視角下所有[cm,i]的平均灰度值,并且所有補償值[dm,i]為0,此時公式(3)可簡化為:

公式(4)可直接利用線性最小二乘求解獲得每張圖像光照系數(shù),由于本文利用球諧函數(shù)的第一階近似,此[lm]是一個4行1列的向量。將公式(4)計算得到的光照系數(shù)代入式(3),且反射率仍固定不變,可以進一步利用最小二乘法計算反射率補償值。將以上計算得到的光照系數(shù)和反射率補償值代入式(5)即可計算得到反射率為:

反射率計算完畢后,將補償值[dm,i]置零,用以下一次迭代使用。在計算得到[lm]、[ρm,i]后還不能直接使用公式(4)計算[nm,i],因為此時(4)是一個欠約束的問題,需要增加合理的約束項。最終優(yōu)化公式為:

其中[t]是迭代次數(shù),當[t=0]時,[nm,i]值為初始人臉模型上頂點[vi]的法線值。式(6)中第3項使更新后的法線不過于偏離初始值。

此時將已計算得到的[lm]、[ρm,i]代入式(6),可其簡化為:

3 模型優(yōu)化

Nehab等[16]提出了一種利用頂點法線優(yōu)化三角形網(wǎng)格的方法,但是該方法需要已知所有頂點的法線,以此為約束使模型變形。本文與文獻[16]相同,首先定義:

其中,[vu,vw]是頂點[vi]的鄰居頂點,它們構成1個三角形網(wǎng)格,[vu,vw]構成[vi]的1條對邊。公式(8)約束每個頂點的法線須垂直于頂點的所有對邊,即利用更新后的法線改變初始模型中頂點位置。文獻[16]中的第二項約束可簡化為:

其中,[vi]是更新后的頂點坐標,[vi*]是更新前的頂點坐標,[ti,1]、[ti,2]是[ni]的切平面中兩個相互垂直的單位向量,式(9)約束頂點沿著法線方向移動,以保持模型網(wǎng)絡結構。

但是在本文中,初始三維人臉模型在每個圖像的視角下只有一部分頂點是可見的,當輸入圖像太少時,比如僅有1張時,會有大量頂點法線沒有通過計算得到更新;即使輸入圖像很多時也難以保證所有法線均能更新。故本文結合文獻[16]、[20]中的非剛性變形法使初始人臉模型變形,定義:

由于公式(8)已經(jīng)達到文獻[20]中通過局部旋轉變換改變頂點位置的目的,因此丟棄文獻[20]中的旋轉變換以減少需計算的參數(shù)數(shù)量。公式(10)要求模型中的每個頂點在改變位置時,須保持其與鄰居頂點的邊長不變。最終目標函數(shù)為:

其中,[λ1、λ2、λ3]分別是[En、Ep、Eedge]的權重,公式(11)同樣是一個線性最小二乘問題。利用公式(6)、(11)可以從圖像重建出網(wǎng)絡結構一致的三維人臉模型。

4 實驗

由于人臉角度不同,進行特征點檢測時,人臉輪廓處特征點會有很大偏差,即正面人臉和側面人臉特征點位置并不一致。因此在生成初始3DMM模型時使用一張正面人臉,根據(jù)文獻[21]檢測的68個特征點生成初始模型;而在更新頂點法線時,為了可更好地使模型與每張圖像對齊,只使用內部51個特征點,并且對于偏差過大的特征點,可手動修正其位置。本文算法與其它算法對比如圖3所示。

從圖3可以看出,本文算法實現(xiàn)的三維人臉,立體細節(jié)更加真實豐富。

5 結語

現(xiàn)有三維人臉模型重建研究大多采用機器學習等方法,無法充分利用人臉一致性網(wǎng)絡結構。本文針對傳統(tǒng)算法進行優(yōu)化,提高了針對性,且成本低、效果好。相比于其它基于光照立體的三維人臉重建方法,本文利用局部剛性約束,使變形后的人臉模型與初始人臉模型具有一致的網(wǎng)絡結構,從而使三維人臉立體性更強、真實度更高。

在使用SFS時,圖像與初始模型對齊程度對最終重建結果有很大影響,因此可通過提高初始模型與目標人臉的相似度及特征點匹配準確度,改進重建結果。將來可進一步將本文算法擴展到基于視頻的三維人臉動畫、三維人臉表情轉移等領域,拓展算法適用性。

參考文獻:

[1] LEO M J, MANIMEGALAI D. 3D modeling of human faces——a survey[C].? International Conference on Trendz in Information Sciences and Computing, 2011:40-45.

[2] BLANZ V,VETTER T. A morphable model for the synthesis of 3D faces[C]. Conference on Computer Graphics and Interactive Techniques,1999:187-194.

[3] PAYSAN P, KNOTHE R, AMBERG B, et al. A 3D face model for pose and illumination invariant face recognition[C]. IEEE International Conference on Advanced Video and Signal Based Surveillance,2009:296-301.

[4] BAS A, SMITH W A P, BOLKART T, et al. Fitting a 3D morphable model to edges: a comparison between hard and soft correspondences[DB/OL].? https://arxiv.org/pdf/1602.01125.pdf.

[5] 董洪偉. 基于網(wǎng)格變形的三維人臉重建[J].? 計算機輔助設計與圖形學學報, 2012, 24(7):932-940.

[6] WOODHAM R J. Photometric method for determining surface orientation from multiple images[J].? Optical Engineering,1980,19(1):1-22.

[7] BASRI R, JACOBS D. Photometric stereo with general, unknown lighting[J].? International Journal of Computer Vision,2007,72(3):239-257.

[8] HORN B K P. Obtaining shape from shading information[M].? Massachusetts:MIT Press,1989.

[9] LEE S W, WANG P, SVETLANA N, et al. Noniterative 3D face reconstruction based on photometric stereo[J].? International Journal of Pattern Recognition & Artificial Intelligence, 2008, 22(3):389-410.

[10] KEMELMACHERSHLIZERMAN I, BASRI R. 3D face reconstruction from a single image using a single reference face shape[J].? IEEE Transactions on Pattern Analysis & Machine Intelligence, 2011, 33(2):394-405.

[11] KEMELMACHERSHLIZERMAN I, Seitz S M. Face reconstruction in the wild[C]. IEEE International Conference on Computer Vision, 2012:1746-1753.

[12] SONG M, TAO D, HUANG X, et al. Three-dimensional face reconstruction from a single image by a coupled RBF network[J].? IEEE Transactions on Image Process, 2012, 21(5):2887-2897.

[13] RICHARDSON E, SELA M, KIMMEL R. 3D face reconstruction by learning from synthetic data[C].? International Conference on 3D Vision, 2016:460-469.

[14] RICHARDSON E, SELA M, OREL R, et al. Learning detailed face reconstruction from a single image[C].? IEEE Conference on Computer Vision and Pattern ,2016:5553-5562.

[15] KEMELMACHER-SHLIZERMAN I,BASRI R. 3D face reconstruction from a single image using a single reference face shape[J].? IEEE Transactions on Pattern Analysis & Machine Intelligence,2011,33(2):394-405.

[16] NEHAB D,RUSINKIEWICZ S,DAVIS J,et al. Efficiently combining positions and normals for precise 3D geometry[J].? ACM Transactions on Graphics,2005,24(3):536-543.

[17] YANG C,CHEN J,SU N,ET AL. Improving 3D face details based on normal map of hetero-source images[C].? IEEE Conference on Computer Vision and Pattern Recognition Workshops,2016:9-14.

[18] ROTH J,TONG Y,LIU X. Adaptive 3D face reconstruction from unconstrained photo collections[C].? ?Las Vegas :Proceedings of IEEE Computer Vision and Pattern Recognition,2018.

[19] ROTH J,TONG Y,LIU X. Unconstrained 3D face reconstruction[C].? IEEE Computer Vision and Pattern Recognition,2017:2606-2615.

[20] BOUAZIZ S, TAGLIASACCHI A, PAULY M. Dynamic 2D/3D registration[EB/OL]. https://www.ixueshu.com/document/9f8b4eb4e828 cf8a318947a18e7f9386.html.

[21] RAMANAN D. Face detection, pose estimation, and landmark localization in the wild[C].? IEEE Conference on Computer Vision and Pattern Recognition, 2012:2879-2886.

(責任編輯:江 艷)

元朗区| 杭州市| 道孚县| 白沙| 同仁县| 祁连县| 黔江区| 新余市| 平遥县| 永州市| 麻阳| 开化县| 汉阴县| 蒙城县| 新龙县| 长子县| 孟州市| 九寨沟县| 镇原县| 岳阳市| 上思县| 攀枝花市| 安多县| 泾川县| 吴堡县| 湛江市| 仙桃市| 方城县| 闵行区| 金湖县| 石嘴山市| 佛冈县| 临潭县| 博爱县| 思茅市| 二连浩特市| 通州市| 乐山市| 云南省| 府谷县| 防城港市|