人臉識別技術論文
人臉識別,特指利用人臉視覺特徵資訊的分析比較結果進行身份鑑別的計算機技術。下面是小編為大家整理的,希望你們喜歡。
篇一
人臉識別技術綜述
摘要:文章首先對人臉識別技術進行了介紹,其次回顧了人臉識別研究的發展歷程及識別方法的基本分類,然後對當前主流的人臉識別方法展開了詳細的論述,最後提出了人臉識別技術面臨的問題及研究方向。
關鍵詞:人臉識別;特徵臉;線形判別分析;區域性二值模式
中圖分類號:TP391
Survey of face recognition technology
He Chun
***Education and Information Technology Center, China West Normal University, Nanchong Sichuan 637002, China***
Abstract: This paper introduces technology of face recognition firstly, and reviews the development process and the basic classification method of face recognition. After that, the paper discusses the current methods of face recognition in detail, therefore proposes the existing problems in the research of recognition faces and future’s research direction.
Key words: face recognition; Eigenface; linear discrimination analysis; LBP
1 人臉識別技術簡介
人臉識別,特指利用人臉視覺特徵資訊的分析比較結果進行身份鑑別的計算機技術[1]。一般人臉識別有廣義和狹義之分,廣義是指包含人臉影象採集、定位、預處理、身份確認與查詢等在內的技術;而狹義僅指身份確認或查詢系統。
通俗來講,人臉識別指運用計算機分析人臉視訊或影象之後,提煉可用、有益的識別資訊,再對人臉物件的身份構建判斷與識別。人臉識別是身份識別研究中最主要的一種方法,重點建立在生物識別技術基礎之上,而且其中應用了諸多計算機相關的圖形學、人工智慧等最新技術手段。
人臉與人體的其他生物特徵***指紋、虹膜等***一樣與生俱來,其生物特徵內在的穩定性和唯一性使其自然成為了身份識別的理想依據。學術界對人臉識別相關問題的研究已然趨近成熟,並形成了為數可觀的研究成果,到目前為止,仍然在不斷的探索與發展中,尤其在人臉身份識別方面的建樹頗多。快速、直接、簡捷是人臉識別系統的獨有優勢,並已廣泛運用於刑事偵破、資訊保安等方面。在此,本次研究將對人臉識別技術給出全面的解析論述。
1 人臉識別發展歷程
早在20世紀50年代,心理學家即已著手對人臉識別展開研究,但是直至60年代,對人臉識別真正意義上的研究才正式開啟,具體是從工程應用層面出發,研究得到一種半自動的人臉識別系統,這種系統具備的特點可描述如下:
一是該系統是對區域性的識別,對人臉的幾何特點識別,進而分析人臉器官特徵資訊及其之間的關係,優勢在於識別手段簡易、清晰,劣勢在於一旦人臉的視角、表情等發生變動和變化,那麼很難準確地得到識別效果;二是這種半自動的人臉影象識別需要較為嚴苛的約束環境和條件,如果影象存在單一或無背景的情況下,那麼就將削弱最終的處理效果。
研究遞進到20世紀90年代以後,即已朝著整體和區域性相結合的態勢演變。學者們認為需要將人臉的形狀拓撲結構、區域性灰度和全域性灰度分佈等多項人臉特徵資訊相結合,才能全面、準確地實現人臉影象識別。1991年,Turk和Pentland [2]、首次提出著名的“特徵臉”***Eigenface***方法,利用主成分分析***Principal Component Analysis,PCA***取得了不錯的識別效果;Belhumer在其論文中,則將Fisher判別準則成功應用到了人臉分類當中,由此而提出Fisherface方法[3]。
此後,這種應用線性子空間和統計特徵的技術就已成為當時大眾化流行的識別技術,可概括為利用成分分析、線性判別分析的特徵識別手段。後期出現了基於機器學習理論的實用技術,學者們相繼探索出遺傳演算法、支援向量機等方法對人臉進行識別。
2 人臉識別方法分類
研究可知從不同的角度,人臉識別可有不同的分類方法,本次研究根據人臉識別發展階段的特徵,把人臉識別技術分為初始以幾何特徵為基礎、中期以代數特點為依據、後期以機器學習理論為原理三種。下面即對這3類研究給出功能實現概述。
2.1 以幾何特徵為基礎的研究
這種方式是將人臉用一個幾何特徵向量予以有效表示,並根據模式識別中層次聚類的思想設計分類器,達到識別目的。識別所採用的幾何特徵是以人臉器官的形狀和幾何關係為基礎的特徵向量,本質上是特徵向量之間的匹配,相應分量通常包括人臉指定2點間的歐式距離、曲率、角度等[4]。
該類研究方式優點是簡單易懂,但是由於能量函式中加權係數的選擇表現出一定的經驗性,並未能形成規範統一的特徵提取標準;而且影象穩定的特徵提取仍有難度,尤其是特徵受阻時;另外,對於明顯的表達變化或不良的姿勢變化,其魯棒性均呈低弱。
2.2 以代數特點為依據的研究
這種方式往往基於代數特徵影象的畫素變換投影空間,具有某種數量的基本影象對人臉影象線性編碼,典型的理論工作可首推主成分分析方法。
主成分分析方法早期是由Sirovitch和Kirby[5]引入人臉識別領域,並將其用於分析資料,過程中是使用數量少的特點來描述為了降低特徵空間維數的樣本,而且是基於K-L來展開和實現的。 2.3 以機器學習理論為原理的研究
由2.1節中的研究方式可知,人臉特徵是預先定義形成的。本節討論的方式,則是通過使用統計分析和機器學習技術,從中獲取資訊。獲得的資訊存在於確定的分佈之中,並通過演算法、模型和判別函式,用作人臉影象識別。這種分類器是時下至關重要的一門技術,而且涵蓋了SVM、Hidden Markov模型與AdaBoost演算法等在內的綜合開發系統技術。
3 人臉識別主流方法介紹
3.1 特徵臉方法
人臉方法來自主成分分析的人臉識別和描述技術。這種方法主要是把影象區域當作隨機變數,運用K-L轉變成為正交K-L基,與較大特徵值相關的對應基具有與人臉相似的形狀,所以也可稱做特徵臉。使用這種線性組合能夠描述、展現近似的人臉影象、人臉識別以及合成。具體表現為把人臉影象對映到人臉子空間之上,同時對人臉影象在特徵臉子空間上的方位進行對比。
3.1.1 人臉空間的建立
研究假設人臉影象包含了眾多畫素點,並且可用N維向量Γ來表示,那麼樣本庫就可用Γi***i=1,...,M***提供應用表達[6] 。人臉空間的基向量由協方差矩陣C的正交特徵向量構成,因此稱為特徵臉。
把特徵值由大到小排列:λ1≥λ2≥...≥λr ,其對應的特徵向量為μk。在此條件下,不同的人臉影象都能投影到由u1, u2, ..., ur組成的子空間中。結果就是不同的人臉影象將對映為子空間中不同的點,反之亦然。
3.1.2 特徵向量的選取
協方差矩陣Ω所生成的非零特徵值的k***k遠小於M***個特徵向量,一般來說k值比較大,但在常規情況下並非需要保留所有有的特徵向量。因為投影的計算速度是同子空間向量數有著密切關聯,如果能夠考慮到時間限度,就能夠提取有效資訊的特徵向量。
3.1.3 預測識別
人臉影象置其投影可得到一組座標系數,該係數能夠表明影象在子空間中的位置,因而可以作為人臉識別的基礎。換言之,每一幅人臉影象皆能顯示出線性組合的“人臉”,加權係數為K-L變換的擴充套件係數,也能作為影象的代數特徵。所以,提取特徵臉資訊後,可向對方典型樣本進行投影,並將得到的投影特徵對映到各研究人臉的特徵向量,作為後續識別匹配搜尋空間的一個步驟。 圖1~圖3給出了不同情況下的特徵臉影象。
3.2 線性判別分析法
線性判別分析,可簡稱為LDA,本質是多維模式空間到一維特徵空間的對映,使用類的成員資訊形成一組特徵向量,構建得到的特徵空間稱為Fisherface。在理論上,這種方式主要是利用類之間的散射矩陣類中的訓練樣本和基於散射矩陣的最優投影空間。和人臉識別方式比較,該種模式能夠抑制不確定影象間的差異資訊,並可以進一步提取利於識別的特徵,因而具有較好的識別效能。
Lades等人認為人臉影象皆有相似的拓撲結構,提出了關於建立在動態連線結構的彈性圖匹配方式基礎上的物體識別問題。每節點涵蓋40個小波係數,集合稱為射流,對小波係數進行原始影象和一組5個頻率,8個方向的Gabor小波卷積。所以每一張影象,就像標籤被逐一校準,而邊緣之間的距離則是通過點來設計校準。因此,針對圖中邊緣編碼後得到的是人臉的幾何形狀,而圖中節點編碼後的結果是灰度值的分佈。實現過程示意如圖4所示。
由圖4可知,彈性圖匹配的意義在於尋找新的人臉,同時提取一張影象,影象類似於束圖,用其可以開展識別工作。當開始識別的時候,計算、測量人臉和目前束圖之間的相似性,具有最大相似性的面部實體就指明瞭測試人臉的身份。
3.3 區域性二值模式
區域性二值模式***Local Binary Pattern, LBP***是執行紋理描述的最佳方法之一, 並已在於各類應用軟體中獲得全面功能發揮,同時經由實踐證得該模式具備著強大的判別能力、計算效率及不變形單調灰度水平變化等顯著優勢[7],因而可將其應用到不同複雜程度的影象分析任務之中。
3.3.1 基本LBP運算元
LBP運算元最初是界定於3×3鄰域,將中心畫素設定成閾值,並將灰度值與其建立對比,大於中心畫素時就記1,反之記0。這時的8個點就能變換為一種8位沒有符號的二進位制數,此二進位制數再轉換為十進位制數,也就是視窗的LBP值。LBP可整體反饋出區域的紋理資訊。基本的LBP運算元如圖5所示。
LBP能夠用鄰域的大小不同,採用圓形面積與雙線性插值,鄰域半徑R和P的畫素數能任意選擇,用符號***p,r***表示畫素區域。常見的LBP運算元參見圖6。
3.3.2 LBP人臉描述
使用LBP手段描述人臉,具體表現為運用紋理描述符對人臉區域性展開詳細的繪製處理,然後將其組合成一體。人臉影象就被分割成幾個區域性區域,從這些不同的區域提取紋理描述符,並共同構成人臉的整體檢視。
把臉部區域分成確定的m份R0、R1、R2、…、Rm-1,直方圖將依序計算每個區域,M的直方圖計算結果整合在一起形成空間,空間增加M×N大小的直方圖,其中的n表示一個直方圖的大小。空間增強的直方圖可以有效地描述3個不同層次的臉部,具體的3個層次分別為:直方圖LBP標識包含一個畫素級別的資訊;地域級是由小的區域上的標誌結合構成的;這些區域的直方圖連線起來,最終形成完整的人臉。
4 人臉識別技術面臨的問題
人臉識別技術存在獨有優勢和廣闊前景,但同時卻也面臨一定問題,而這些問題是卻均是源起於人臉具備的生物特徵的某些顯性表象。人臉在視覺上的特點可實際剖析如下:
一方面由於個體間差別較小,人臉、人體器官構成也比較類似,雖然對人臉定位是佔優勢的,而對區別個體卻產生干擾;另一方面,人臉的表情變化產生的視覺影象也會導致差異。此外,人臉影象識別時還會受到其他約束條件影響,比如光照、年齡、遮蓋物等。因此,解決上面提及的各類問題則既是創新,也是挑戰,更是人臉識別技術開展未來研究的後續發展方向。
參考文獻:
[1] 吳巾一,周德龍. 人臉識別方法綜述[J]. 計算機應用研究, 2009, 26***9***: 3205-3209.
[2] TURK M, PENTLAND A. Eigenfaces for recognition [J]. Journal of cognitive neuroscience, 1991, 3***1***: 71-86.
[3] BELHUMEUR P N, HESPANHA J P, KRIEGMAN D. et al. fisherfaces: Recognition using class specific linear projection [J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1997, 19***7***: 711-720.
[4] BARTLETT M, LADES H, SEJNOWSKI T. Independent component representations for face recognition[C]//Proceeding of the SPIE Symposium on Electronic Imaging: Human Vision and Electronic Imaging . San Jose, CA:IEEE, 1998, 3299:528-539.
[5] KIRBY M, SIROVICH L. Application of the Karhunen-Loeve procedure for the characterization of human faces [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990, 12***1***:103-108.
[6] SAMARIA F, YOUNG S. HMM based architecture for face identification [J]. Image and Computer Vision, 1994, 12***8***: 537-543.
[7] AHONEN T, HADID A, PIETIKAINEN M. Face description with local binary patterns: Application to face recognition [J]. IEEE Trans. Pattern Anal. 2006, 28***5***: 2037-2041.
點選下頁還有更多>>>
史記中著名的故事有哪些