歡迎來到裝配圖網! | 幫助中心 裝配圖網zhuangpeitu.com!
裝配圖網
ImageVerifierCode 換一換
首頁 裝配圖網 > 資源分類 > DOC文檔下載  

SIFT特征在臉部識別中的研究與應用

  • 資源ID:116650250       資源大小:964.50KB        全文頁數:9頁
  • 資源格式: DOC        下載積分:20積分
快捷下載 游客一鍵下載
會員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要20積分
郵箱/手機:
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機號,方便查詢和重復下載(系統(tǒng)自動生成)
支付方式: 支付寶    微信支付   
驗證碼:   換一換

 
賬號:
密碼:
驗證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標題沒有明確說明有答案則都視為沒有答案,請知曉。

SIFT特征在臉部識別中的研究與應用

SIFT特征在臉部識別中的研究與應用摘要: 一些模式識別和分類技術已經應用到生物領域。其中,一個有趣的技術是尺度不變特征變換(SIFT),它在最初設計時是用于對象識別。盡管SIFT特征已經成為一種非常強大的特征描述方法,但它在人臉識別技術方面的應用卻從來沒有過系統(tǒng)的研究。本文探討的是SIFT特征算法在人臉識別方面的應用。為了確定方法的真正潛力和適用性,不同的匹配方案將用BANCA數據庫來測試,以便得到最適合的方法。1 引言人臉識別可能是第一個被人們用來認識熟悉的人的認知過程。雖然也可采用其它感官線索,比如說語音,步態(tài),甚至是出生時的氣味,但是這個識別已知臉的能力,在人們出生的時候就有了。這些問題,使得臉部識別在生物特征識別和計算機視覺的研究性領域中,變得非常有趣。人臉識別是一個復雜的問題,但是基本上可以歸結為模式分類的問題。許多模式識別技術已經投入運用,而且其它的也正在進行開發(fā)研究。臉部分析的案例由于一些臉部的特征與其它模式識別問題是不常見的,因而具有更多的復雜性。 維數的詛咒(至少處理一個2 D圖像)由于分類模式多樣化而更加復雜。臉部不是一個嚴格對象,并且它會有連續(xù)的非剛性變形。臉部不同的東西同時也是它們的共同之處,比如說兩只眼睛和一張嘴巴。雖然臉部一般作為一個二維物體進行處理,但是因為臉部的三維結構和它在空間的運動,會產生許多歧義并導致一些假說的失敗。因為這些原因,人類的臉部分析就面臨了一個不確定的問題。因此不同技術已經運用到限制模式匹配和分類過程。其中,對于減少臉部空間維度有許多值得介紹的方法,它們都是通過不同的優(yōu)化處理過程達到目的,如主成分分析(PDA)、線性判別分析(LDA),費舍爾判別分析(FDA)與獨立分量分析(ICA)。其它技術則是基于圖像上臉的表面約束和模型,且都以形狀和紋理信息的形式顯示。還有一些方法是通過運用伽柏核心程序的多尺度濾波,從而得到臉部顯著特征的提取和分類。沿著這個方向,對“人臉模型變形”的估計和漸進變形會派生出一個新的技術,即三維人臉和它在圖像上的二維表現形式之間的約束映射。近來,尺度不變特征變換(SIFT) 方法可用于識別一般物體時進行邊緣切除,該方法目前主要應用在這個領域,同時其它的機器視覺中也有所應用。SIFT算法中一個有趣的特點是,通過圖像產生的尺度空間提取出本地模型,并從這個模型中提取灰度級別的特征點。在這方面, SIFT方法與本地二進制模式方法類似,它們的區(qū)別是:從提取的2D模型中得到的視圖不變性的表現形式有所不同。先不論這個技術的潛力和廣泛的適用性,就二維圖像的分類而言,至少據我們所知,它從未在人臉識別/驗證上運用過。在本文中,首次嘗試應用SIFT對臉部進行分類。這個基本SIFT方案會在一個標準人臉數據庫中進行測試,該數據庫由三種不同匹配技術構成。一般來說,利用對物體幾何對象的先驗知識,可以同時在精度和速度上用來提高識別性能。因此,核心的SIFT算法已經適應了根據三個不同方案而得到的臉部圖像分類。在擬定的解決方案中,根據臉部幾何形狀,對提取的特征進行選擇和分組,其分組依據是對臉部幾個特征位置的先驗知識(通常是眼睛和嘴巴)。從結果中很容易看到,當根據臉部幾何形狀進行特征篩選時,分類將會更加精確。從這方面看,用于臉部識別技術的真正潛力和廣泛實用性已經得到了研究。2 尺度不變特征變換在2004年,David Lowe提出了一種從圖像中提取不變特征的方法。它稱之為尺度不變特征變換(SIFT)方法。這一類型特征的特點是對圖像的尺度和旋轉具有不變性,并能對大范圍的仿射失真進行魯棒匹配、改變3D視點、增加噪聲以及改變照亮度,從而提供準確的匹配。它們在空間域和頻率域都有很好的布局,以減少因阻斷、雜波或噪音而造成中斷的可能性。大量的特征可以通過有效的算法從典型圖像中提取出來。一張500*500像素的典型圖像會產生2000個穩(wěn)定特征點(雖然這個數字取決于圖像內容和所選擇的各種參數)。此外,這些特征是非常獨特的,它允許單個特征點與大型特征庫進行正確匹配,這些特征庫會提供物體的基本圖像和場景識別。通過級聯濾波的方法使提取特征的成本實現最小化,只有通過初步測試后 ,才會進行稍復雜的計算。以下是生成圖像特征的主要計算步驟:1尺度空間極值檢測:計算第一步即搜索所有尺度和圖像位置。通過高斯差異分布識別潛在的興趣點,這些點應具有尺度和旋轉不變性。給出一個高斯模糊圖像:在這里,I(x, y)即為所給圖像,同時,為了在尺度空間中(G為尺度空間),有效地檢測到穩(wěn)定的關鍵點的位置,應該使用11中提到的方法。圖1. 模糊圖像處于不同尺度,并且是模糊高斯分布的計算。圖2. 局部極值的檢測,標記有X的像素被拿來與處于3*3*3鄰域內的26個鄰居做比較,跨越了相鄰的DoG的圖像。在高斯差異函數(D(x,y,))與圖像進行卷積時,用到了尺度空間極值,其中D(x,y,)由兩個相鄰尺度的差計算得到,其中,兩個相鄰尺度相差一個常數與系數k的乘積:興趣點(在SIFT中也稱為關鍵點)是DOG圖層所有尺度中的極大值或極小值。DoG圖層中的每一個像素均與它同尺度中的8個鄰域點作比較,同時還要和相鄰尺度的上下各9個點進行比較。如果這個像素是最大值或者最小值,它就被選定為候選的關鍵點。2. 關鍵點的定位:在每個候選的位置上,建立一個詳細的模型來確定位置和尺度。通過衡量它們的穩(wěn)定性來決定關鍵點的的選取。 一旦一個候選的關鍵點是通過與鄰域像素比較而得到時,那下一步就要記錄關于它附近的位置、尺度和旋轉主曲率等詳細數據。當一個點具有很低的對比度(因此對噪聲很敏感)或者在邊緣附近時,我們就會將這個店排除。3. 分配方向:根據本地圖像的梯度方向,關鍵點會被分配到一個或者多個的方向。為了確定關鍵點的方向,根據相鄰關鍵點(高斯圖像中最接近關鍵點尺度的點)的方向生成一個梯度方向直方圖。每個相鄰像素點都由其梯度大小值和尺度為關鍵點1.5倍的高斯窗加權得到。直方圖的峰值對應關鍵點主方向。為了使主方向對應到直方圖的極大值,會生成一個單獨的關鍵點。并且其它任何方向都會小于最大值的百分之80。同時,所有關于關鍵點方向的屬性都會確定,這就保證它們具有了旋轉不變形。4. 關鍵點描述符:在每個關鍵點所在區(qū)域的選定的尺度內,對本地圖像梯度進行測量。這就意味著允許局部形狀畸變和照明度的改變。一個關鍵點的方向一旦確定,那么特征描述子將會由一系列在4*4像素區(qū)域上的直方圖計算得到。方向直方圖與關鍵點方向相關,這個方向數據來自于與關鍵點尺度最接近的高斯圖像。就像之前那樣,每個相鄰像素點都由其梯度大小值和尺度為關鍵點1.5倍的高斯窗加權得到。每個直方圖包含8個二進制文件,每個描述符包含一個關鍵點周圍的4個直方圖的數組。這就構成了一個SIFT的特征向量的4*4*8 = 128個元素。這個向量經過歸一化處理以實現亮度不變性,這樣,這個描述符就對光照的仿射變化具有不變性。 圖3和圖4中給出了一些SIFT算法應用于臉部圖像(數據庫BANCA)識別的例子。特別是在具有統(tǒng)一主題的前三個圖像中,共同的特征都已經表示出來(用黑點表示):這對于相應特征的匹配提供了可能性。后面三個圖像則呈現出三個不同的主題:在這種情況下,SIFT特征區(qū)別很大。圖3. 圖像過濾提取的例子。這些圖像在不同造型中,呈現出相同對象。黑點表明在所有的三幅圖中的共同穩(wěn)定SIFT。3 匹配策略為了識別一張臉,在測試圖像中計算的SIFT特征,應該與模板的SIFT特征相匹配。在本節(jié)中,會對不同的匹配方法進行研究。它們不同于Lowe的方法,在某種意義上,它們會更加的簡單,同時也與我們正在解決的問題有更緊密的聯系。此外,這個方法更注重識別,而不是認證(識別意味著找到更好的匹配,用優(yōu)化過的霍夫變換來解決)。圖4. 運用提取SIFT的示例圖。這些圖像呈現了不同對象。這個SIFT差別也很大。在每個匹配策略開始都會使用兩套特征,分別是在測試圖像上的計算和在模板圖像上的計算。就如前面第二節(jié)所解釋的一樣,每個特征都是四部分組成:軌跡(特征的位置)、尺度、方向和描述符。最后的描述符是一個128維的向量。為簡單起見,給出一個關鍵點Ki,我們先分別稱F(Ki),L(Ki),S(Ki)和O(Ki)為它的特征描述、位置、尺度和方向。針對不同的方法,會需要SIFT特征中的一部分或者所有的信息。3.1. 一對最小距離這個方法是最簡單的一種:計算兩個圖像中所有關鍵點描述對的距離,再把最小距離當做匹配得分。更確切的說,給出兩張圖像Itest和Itemp,分別代表著測試圖像和模板圖像,兩套特征經過計算:這個匹配得分 (一對最短距離)通過計算得到。在這里,是描述符的距離。盡管可以采用更復雜的方法(見19),但本文只對歐氏距離進行簡單的研究。這個簡單的方案既沒有采用位置也沒有采用尺度和方向的信息:它表現出了一個最基本的系統(tǒng)。這個方法的主要思想是,一個對象的臉可能包含了許多鮮明的特征,在這張臉上的一個特征點可以與測試圖像中的特征點進行匹配。3.2. 眼睛和嘴的匹配第二個方法考慮到了臉部大部分的信息,主要聚集在眼睛和嘴的周圍。一旦這些目標位置被確定下來,這個匹配策略就可以只考慮歸屬于這個區(qū)域的SIFT特征而忽略其它圖像區(qū)域的信息點。針對眼睛和嘴巴位置的不同,人們提出了不同的技術(見例6和其中的參考):在這里我們假設這個位置是已知的。給一張圖像I,提取兩張子圖片:一張位于眼睛附近,一張位于嘴附近,我們分別稱為Ieyes和 Imouth。這個匹配將在成對組合方式下執(zhí)行,即眼睛對眼睛,嘴巴對嘴巴。最后平均計算一下這兩個距離。更確切的說即是:3.3. 在規(guī)則柵格上匹配第一個方法沒有考慮到特征點的位置:這就引發(fā)了一個問題,因為兩個關鍵點的最小距離不可能在相同臉部部分聯系起來。換句話說,臉部所有部分都可以相互匹配是不現實的。因為只考慮了眼睛和嘴巴,所以這個問題在第二個方法中得以解決。不過在這種情況下,位于右眼的特征可以與左眼的特征相匹配。因此,如果這張圖像或多或少的注冊過,那么位置相關匹配就可以實現。注冊是面部認證和識別的一個特別重要的問題,應該得到合理解決。然而它是與認證/識別是完全不同的問題,并且應該在應用匹配技術前得到解決。事實上,在最近所有的數據庫中(就像BANCA),為了允許圖像重新注冊,眼睛的位置都會給定:只有這樣匹配方法才可得到充分研究。在本文,我們假設圖像已注冊。這段中介紹的匹配方法是利用重疊的規(guī)則柵格將圖像細分成不同的子圖。通過計算所有成對對應的子圖像之間的特征距離并做平均處理后,進行兩張圖像的匹配。更確切的來說,這兩張圖像將被細分為一系列局部重疊的子圖像,稱為I1IT。經過初步實驗評估后(這里沒有給出),我們發(fā)現尺寸分別為長寬的1/4和1/2的子圖像,表現出在精確定位和修復注冊錯誤之間的折中辦法。這個重疊設定為25%。最后這個匹配得分(規(guī)則柵格)就是計算成對圖像匹配分數的平均值。即:4 實驗評價以下臉部認證的實驗在BANCA數據庫上進行一1個包括臉部和聲音的多模式數據。用于臉部識別的部分由52個對象組成(26個女性,26個男性)。對于每個對象,記錄了在不同條件下的12個不同的類別。對于每個類別,會提取5張圖像,用于練習及客戶或冒充者的測試。在BANCA協議中,隨著難度不斷提升,定義了7種不同的實驗配置。在我們的實驗中,我們用匹配控制協議(MC),這個協議將圖片從第一個類別里集中起來用于練習,而來自第二、三、四類別圖像用于測試。在這個例子中,我們使用已注冊的圖像,這樣圖像的位置標注信息就已知。特別是在預處理階段,所有的圖像都在直方圖均衡化后進行簡單的幾何歸一化處理。在幾何歸一化中,這個臉部將被映射到一張210*200像素的輸出圖像中去。這個映射使用了仿射變換只變換平移、旋轉和尺度。這個圖像可以通過人工說明的方法進行轉換,例如注釋眼睛的映射位置為輸出圖像邊緣的25%且自圖像頂端向下35%處的點??梢允褂脴藴史椒▽χ狈綀D進行均衡化。為了得到研究結果,測試圖像將被分為兩組,G1和G2,每組有26個對象。錯誤率由下列步驟計算得到: 在G1上做實驗,得到G1分值 在G2上做實驗,得到G2分值 用G1分值來計算ROC曲線,來決定現有的等錯誤率以及對應的閥值G1 用閥值G1來計算錯誤接受率Rate(FARG2(G1)以及G2分值上的錯誤拒絕率。 通過下列計算G2的誤差加權率(WER(R)R=0.1、1和10 在G1上用雙重方法計算WER(R)參數R預測了在錯誤接受和錯誤拒絕之間的成本率。SIFT特征已經用Lowe的代碼進行計算。這三種匹配方法已經進行測試:在表1和表2中給出識別的精確度。G1和G2的均等錯誤率在表1中呈現(對應的ROC在圖5中顯示),而加權錯誤率在表2中,分別針對三種不同的R值。從表和圖形中可以得出,考慮背景信息是有益的:當對比臉部對應的部分時,會得到明顯的改進。特別是集中臉部和嘴的比較后,改善會更加明顯。此外,當運用規(guī)則柵格的方法去比較對應部分時,我們會得到最好的結果。以上這些結果揭示出在匹配中位置信息扮演的重要角色。 表1. 在G1和G2上,對三種方法的前誤差?!癕PD”代表了一對最小距離?!癊M”針對眼睛和嘴,“RG”針對規(guī)則柵格。圖5. G1和G2的ROC曲線:“MPD”代表一對最小距離,“EM”針對眼睛和嘴,“RG”針對規(guī)則柵格表2. 針對三種方法的不同的文字差錯率:“MPD”代表一對最小距離,“EM”針對眼睛和嘴,“RG”針對規(guī)則柵格。5 結論在本文中,主要介紹了SIFT特征應用于人臉識別技術中的方法。目前已提出三種不同的匹配技術,即:計算兩個圖像中關鍵點描述子之間的距離并將最小距離作為匹配得分。只使用屬于眼睛和嘴巴周圍區(qū)域的SIFT特征。對位于規(guī)則柵格和匹配重疊部分的SIFT特征進行匹配。已利用三種技術分別對BANCA數據庫中G1和G2的圖像組進行集中測試。從實驗的開展分析,沿規(guī)則柵格進行匹配的方法優(yōu)于其它兩種方法,而一對最小距離方法為較差的方法。即使取得的分數與分類測試數據庫中的標準人臉不能很好匹配,它們仍然確認SIFT特征在這方面的適用性。值得注意的是亮度和形狀并沒有進行精確的規(guī)范化。SIFT特征在該領域的首次應用中就提出過這個問題,在特征匹配過程中,必須考慮到臉形的特殊性和多變性。另一方面,SIFT算法本身應進一步分析和調整,以充分適應人臉形狀和紋理。這是朝這個方向的首次嘗試,未來將會研究更復雜的匹配技術和適當的特征分類的應用。為了更好地了解該方法的實際潛力,我們與其它方法(如PCA或LDA)進行比較。未來將研究的另一個方向是使用SIFT特征解決圖像注冊問題。

注意事項

本文(SIFT特征在臉部識別中的研究與應用)為本站會員(good****022)主動上傳,裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知裝配圖網(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。




關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網版權所有   聯系電話:18123376007

備案號:ICP2024067431-1 川公網安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。若文檔所含內容侵犯了您的版權或隱私,請立即通知裝配圖網,我們立即給予刪除!