3
quan đến ảnh mặt người) nên Local Binary Pattern (LBP) được chọn
trong hệ thống nhận dạng khuôn mặt.
2. Mục đích của đề tài
Nghiên cứu cách thức xây dựng một hệ thống nhận dạng nói
chung và nhận dạng khuôn mặt nói riêng.
Nghiên cứu về đặc trưng rất thông dụng trong các bài toán liên
quan đến ảnh khuôn mặt nói chung và nhận dạng khuôn mặt nói
riêng: Local Binary Pattern (LBP).
Tìm hiểu kỹ về lý thuyết toán và lập luận của bài toán rất nổi
tiếng, kinh điển EigenFace: là hệ thống nhận dạng mặt người dựa
trên subpace Principal Component Analysis (PCA).
Bên cạnh nghiên cứu sâu về đặc trưng LBP và subspace PCA,
luận văn còn mở rộng tìm hiểu và giới thiệu một số các đặc trưng
cũng như các bộ phân lớp phổ biến khác trong bài toán nhận dạng.
3. Ý nghĩa khoa học đạt được
Đề tài góp phần giới thiệu các bước tiến hành để xây dựng hệ
thống nhận dạng nói chung và nhận dạng khuôn mặt nói riêng.
Nghiên cứu và kiểm chứng lý thuyết toán về bài toán eigen
(eigenvalues, eigenvector) và các tính chất toán học của PCA trong
khuôn khổ ứng dụng nhận dạng khuôn mặt.
Cài đặt thử nghiệm và đánh giá bằng thực nghiệm các kỹ thuật
trong rút trích đặc trưng cục bộ Local Binary Pattern (LBP) và phân
loại đối tượng dựa trên subspace Principle Component Analysis
(PCA).
Những nghiên cứu này sẽ hỗ trợ cho việc áp dụng PCA để giải quyết
nhiều bài toán khác đặt ra trong thực tế như: giảm số chiều
4
(dimensionality reduction), hồi phục ảnh (reconstruction), phân đoạn
ảnh (segmentation), .
4. Ý nghĩa thực tiễn đạt được
Luận văn nghiên cứu một kỹ thuật rất kinh điển, nổi tiếng và
quan trọng trong lĩnh vực nhận dạng khuôn mặt là EigenFace.
Luân văn đã xây dựng thành công hệ thống nhận dạng khuôn
mặt trên đặc trưng cục bộ Local Binary Pattern (LBP) và subspace
Principle Component Analysis (PCA).
Bên cạnh đó, đề tài này góp phần xây dựng chương trình nhận
dạng khuôn mặt người để áp dụng cho nhiều ứng dụng thực tiễn,
nhằm đáp ứng cho các yêu cầu như nhận dạng, bảo mật ngày càng
cao.
Ngoài ra, đề tài đã xây dựng cơ sở dữ liệu trong thực tế trên
khuôn mặt người Việt Nam, đóng góp thêm vào bộ cơ sở dữ liệu
chung của cả nước.
5. Mục tiêu và nhiệm vụ
Với mục đích như trên, mục tiêu và nhiệm vụ của luận văn
được xác định như sau:
Tìm hiểu mô hình bài toán và các bước thực hiện để xây dựng
một hệ thống nhận dạng khuôn mặt người.
Tìm hiểu, nắm các công nghệ đã và đang được áp dụng cho
từng bước có trong hệ thống.
Hiểu rõ lý thuyết toán học và tính chất đặc trưng của những kỹ
thuật sẽ được sử dụng để giải quyết bài toán trong khuôn khổ luận
văn.
5
Tìm hiểu và sử dụng các công cụ hữu ích nhằm phục vụ cho
bài toán nhận dạng mặt người cũng như trong quá trình xây dựng hệ
thống: MASM, OpenCV, Matlab.
Ngoài cơ sở dữ liệu chuẩn MBGC công bố tại địa chỉ trang
web http://www.nist.gov/itl/iad/ig/mbgc.cfm, tôi sẽ tiến hành xây
dựng dữ liệu thực tế trên khuôn mặt người Việt Nam nhằm phục vụ
cho chương trình thực nghiệm.
6. Đối tượng và phạm vi nghiên cứu
Các phương pháp, giải thuật phục vụ cho việc phát hiện và
nhận dạng khuôn mặt người trên ảnh.
Phần mềm Matlab, đặc biệt là những thư viện phục vụ cho
việc xử lý ảnh, phát hiện và nhận dạng mặt người.
Bộ cơ sở dữ liệu chuẩn Multiple Biometric Grand Challenge
(MBGC) và bộ cơ sở dữ liệu do sinh viên tự thu thập.
Phạm vi nghiên cứu:
Việc xử lý và nhận dạng ảnh khuôn mặt thỏa mãn các điều
kiện sau:
Ánh sáng đều, không có chiếu sáng (no illumination), không
có ánh sáng mạnh (no strong lighting);
Góc ảnh: trực diện (frontal) hoặc gần như trực diện;
Không bị che khuất (no occlusion);
Ảnh chất lượng cao (high quality images).
7. Kết quả dự kiến
Chương trình (ở mức thử nghiệm) nhận dạng mặt người trên
dữ liệu chuẩn Multiple Biometric Grand Challenge Database
(MBGC) đạt trên 90%.Thử nghiệm chương trình trên dữ liệu thực tế
(Vietnamese database) và khả năng nhận dạng đạt được 70% - 80%.
6
8. Bố cục luận văn
Bố cục luận văn gồm có 3 chương chính:
Chương 1: Cơ sở lý thuyết
Chương này giới thiệu tổng quát các bước cần thực hiện trong
bài toán nhận dạng. Bên cạnh việc giới thiệu các kỹ thuật liên quan
phổ biến, đối tượng và phạm vi nghiên cứu cũng được định nghĩa,
trình bày chi tiết trong chương này.
Chương 2: Lựa chọn giải pháp và kỹ thuật
Tập trung trình bày về đặc trưng cục bộ Local Binary Pattern
(LBP) và Principal Component Analysis (PCA). Các lý thuyết toán,
lập luận được phân tích và trình bày rõ trong từng bước thực hiện.
Đặc điểm và tính chất của hai kỹ thuật cũng được phân tích kỹ trong
chương này.
Chương 3: Hệ thống nhận dạng khuôn mặt dựa trên LBP và PCA
Xây dựng được demo chương trình nhận dạng khuôn mặt,
trong phạm vi của luận văn thì bộ dữ liệu chuẩn Multiple Biometric
Grand Challenge Database (MBGC) và bộ dữ liệu do chính sinh viên
tự thu thập được sử dụng. Ngoài ra thì khả năng và hiệu quả của hệ
thống cũng được so sánh, đánh giá với các phương pháp khác.
7
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT
1.1. XỬ LÝ ẢNH
1.1.1 Giới thiệu
Các bước cơ bản trong xử lý ảnh
Hình 1.1. Các bước cơ bản trong xử lý ảnh
Phần thu nhận ảnh: Ảnh có thể nhận qua camera. Có thể là
màu hoặc đen trắng với độ phân giải khác nhau.
Tiền xử lý: lọc nhiễu, nâng cao chất lượng ảnh.
Phân vùng ảnh hay phân đoạn: tách ảnh thành các vùng hoặc
đối tượng quan tâm.
Biểu diễn ảnh: Việc chọn các tính chất để thể hiện ảnh gọi là
trích chọn đặc trưng (feature extraction).
Nhận dạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác
định ảnh. Quá trình này thường thu được bằng cách so sánh với mẫu
chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán theo ý
nghĩa trên cơ sở nhận dạng.
Cơ sở tri thức: Nhằm giúp quá trình xử lý và phân tích ảnh
theo cách làm của con người.
8
1.1.2. Một số kỹ thuật xử lý ảnh liên quan đến bài toán
nhận dạng khuôn mặt
1.2. BÀI TOÁN NHẬN DẠNG MẪU
1.2.1. Giới thiệu và định nghĩa bài toán
1.2.2. Các vấn đề liên quan đến nhận dạng
1.2.3. Một số lĩnh vực ứng dụng
Person
Person
Person
Tree
Tree
Building
Building
Grass
Hình 1.1. Ảnh nhận dạng đối tượng trong tự nhiên
1.3. DÒ TÌM KHUÔN MẶT
1.3.1. Giới thiệu và định nghĩa bài toán
1.3.2. Một số hướng tiếp cận trong dò tìm khuôn mặt
1.3.3. Phương pháp dò tìm dùng trong khuôn khổ luận văn
Trong khuôn khổ của luận văn, quá trình dò tìm khuôn mặt và
các điểm mốc khuôn mặt được thực hiện bằng công cụ Modified
Active Shape Model (MASM). Công cụ này do giáo viên hướng dẫn,
hiện đang công tác ở Biometrics Lab, Carnegie Mellon University
(CMU), Pittsburgh, PA, USA cung cấp. Bộ công cụ MASM là một
9
phần trong dự án nhận dạng khuôn mặt được cục FBI, USA đầu tư
phát triển từ năm 2010.
Hình 1.2. Tiến trình dò tìm, định vị khuôn mặt
1.4. NHẬN DẠNG KHUÔN MẶT
1.4.1. Giới thiệu và định nghĩa bài toán
1.4.2. Một số khó khăn, thử thách trong nhận dạng khuôn
mặt
Một số khó khăn, thử thách trong nhận dạng khuôn mặt:
Hướng (pose), sự có mặt của các chi tiết không phải là đặc trưng
riêng của khuôn mặt người như: râu quai nón, mắt kính, ….các nét
mặt (facial expression), mặt người bị che khuất, điều kiện ảnh, đặc
biệt là về độ sáng và chất lượng ảnh.
Để hạn chế các khó khăn trên, bài toán được định nghĩa và tiến
hành trong các điều kiện sau: Ánh sáng đều, không có chiếu sáng (no
illumination), không có ánh sáng mạnh (no strong lighting), góc ảnh
trực diện (frontal) hoặc gần như trực diện, không bị che khuất (no
occlusion), ảnh chất lượng cao
10
Hình 1.3. Một số hình ảnh trong database MBGC (dòng 1)
và ảnh do sinh viên tự thu thập(dòng 2)
1.4.3. Đặc trưng thông dụng trong nhận dạng khuôn mặt
Một số đặc trưng thông dụng trong nhận dạng (tổng quát)
được nghiên cứu và trình bày như sau:
Đặc trưng Gaussian với các trị sigma (σ) và tỷ lệ khác nhau.
Hình 1.4. Ảnh minh họa sau khi lọc với Gaussian
Đặc trưng Local Binary Pattern (LBP) và các biến thể
LBP nguyên thể
Mẫu đồng dạng
LBP
LBP bất biến quay
LBP đồng dạng bất
biến quay
Hình 1.5. Ví dụ về biến thể của LBP
11
Histogram of Oriented Gradients (HOG)
Thay vì tính toán gradient (tích vô hướng) trên 2 chiều là x và
y, HOG được sử dụng để tính gradient cho tần số cao (high
frequency) trên các chiều khác nhau.
Ảnh gốc 9 bins 18 bins
9x9 = 81 bins histogram
9x18 = 162 bins histogram
Hình 1.6. Đặc trưng HOG tương ứng với kích thước khối
ảnh 3x3 với 9 hướng (cột 2) hoặc 18 hướng (cột 3)
1.4.4. Bộ phân lớp
Bộ phân lớp dùng trong bài toán nhận dạng cũng rất đa dạng,
tùy thuộc vào dữ liệu. Một số bộ phân lớp phổ biến trong nhóm phân
lớp tuyến tính được trình bày như sau:
Principal Component Analysis (PCA): Mục tiêu của PCA là
tìm ra một không gian đặc trưng mới với số chiều giảm hơn nhiều so
với số chiều ban đầu nhưng vẫn đảm bảo đặc tính của tập dữ liệu.
Biểu đồ mô tả các điểm khác nhau
trên trục tọa độ.
Góc này mô tả giá trị lớn nhấtcủa
các điểm trên trục mới được vẽ lại.
Hình 1.7. Minh họa cho phương pháp tìm trục chiếu của
PCA
12
Linear Discriminant Analysis (LDA): có thể đưa 2 điểm dữ
liệu trên cùng 1 lớp nằm gần về với nhau. Các điểm dữ liệu không
cùng nằm về 1 lớp thì chúng sẽ cách xa nhau hơn.
Hình 1.8. Phương pháp biểu diễn dữ liệu LDA
Support Vector Machine(SVM): tìm và lựa chọn ranh giới giữa
hai thể loại sao cho khoảng cách từ các ví dụ huấn luyện (support
samples) tới ranh giới là xa nhất có thể.
Hình 1.9. Ví dụ về phân lớp dữ liệu bằng phương pháp
thông thường NN (2 cột đầu) và bằng SVM (cột cuối)
Không có nhận xét nào:
Đăng nhận xét