Những phương pháp tiếp cận về kỹ thuật giám định ảnh số

Một bức ảnh số có thể d dàng đ ợc chỉnh sửa về mặt hiển thị nh vào các phần mềm chỉnh sửa ảnh

nhất định ơ sở của việc gi m định tính chân thực của ảnh là mặc dù ảnh giả có thể hông để lại bất kỳ

dấu v t hay điểm bất th ng gì báo hiệu đã qua chỉnh sửa, nh ng có thể đặc tính thống kê pixel trên ảnh

đã bị thay đổi. Bài vi t này là một tổng quan về ph ơng ph p gi m định ảnh số, chú tr ng vào ph ơng

pháp phát hiện mù từ công trình khởi đầu của Fridrich năm 2003 đ n các công trình mới trong nửa đầu

năm 2016 Hầu h t c c ph ơng ph p hiện tại đều đ ợc x p vào các nhóm phân loại và đ ợc phân tích đi

kèm với nhận xét và trích dẫn từ tác giả. Bài vi t cũng đề ra thách thức và tiêu chí đ nh gi trong việc

gi m định ảnh giả, từ đó làm cơ sở để phân tích và so sánh giữa c c ph ơng ph p h c nhau

pdf 11 trang dienloan 9280
Bạn đang xem tài liệu "Những phương pháp tiếp cận về kỹ thuật giám định ảnh số", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Những phương pháp tiếp cận về kỹ thuật giám định ảnh số

Những phương pháp tiếp cận về kỹ thuật giám định ảnh số
TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 20 (45) - Thaùng 9/2016 
3 
Những phương pháp tiếp cận 
về kỹ thuật giám định ảnh số 
Approaches to techniques of digital image forensics 
 han r ng 
 i n h ng 
 r ng Đại h c B ch hoa 
Phan Trong Le, BEng. 
Le Tien Thuong, Assoc.Prof.,Ph.D. 
Ho Chi Minh City University of Technology 
Tóm t t 
Một bức ảnh số có thể d dàng đ ợc chỉnh sửa về mặt hiển thị nh vào các phần mềm chỉnh sửa ảnh 
nhất định ơ sở của việc gi m định tính chân thực của ảnh là mặc dù ảnh giả có thể hông để lại bất kỳ 
dấu v t hay điểm bất th ng gì báo hiệu đã qua chỉnh sửa, nh ng có thể đặc tính thống kê pixel trên ảnh 
đã bị thay đổi. Bài vi t này là một tổng quan về ph ơng ph p gi m định ảnh số, chú tr ng vào ph ơng 
pháp phát hiện mù từ công trình khởi đầu của Fridrich năm 2003 đ n các công trình mới trong nửa đầu 
năm 2016 Hầu h t c c ph ơng ph p hiện tại đều đ ợc x p vào các nhóm phân loại và đ ợc phân tích đi 
kèm với nhận xét và trích dẫn từ tác giả. Bài vi t cũng đề ra thách thức và tiêu chí đ nh gi trong việc 
gi m định ảnh giả, từ đó làm cơ sở để phân tích và so sánh giữa c c ph ơng ph p h c nhau 
Từ khóa: phát hiện ảnh giả, pháp chứng, kỹ thuật watermarking, chữ ký signature, ảnh cloning, 
splicing, retouching, ảnh tạo hoàn toàn từ máy tính (CGI), biến đổi cosine rời rạc (DCT), phân tích 
thành phần chính (PCA), máy vector hỗ trợ (SVM). 
Abstract 
A digital image can be visually changed with ease by using certain editing software. A foundation on 
which we are relying is the assumption that although digital forgeries may leave no visual evidences 
indicating the tampering, they may have altered the statistical properties of pixel values in the image. This 
paper is a literature review on digital image forgery detection focusing on blind detection approach, from 
the very beginning work of Fridrich in 2003 to the recent ones in the first half of 2016. Most of the 
proposed methods are well classified into categories and analyzed with comments and citations. This work 
also indicates the vital challenges and criteria of performance evaluation to the detection of forgery 
images, which are considered as the basis of comparison between different methods. 
Keywords: digital image forgery, forensics, watermarking, signature, copy-move, splicing or retouching 
image, computer-generated imagery (CGI), affine transform, discrete cosine transform (DCT), discrete 
wavelet transform (DWT), principal component analysis (PCA), support vector machine (SVM). 
 4 
1. ặt v v k thu t nh 
 nh s 
Nhi p ảnh dần trở thành lĩnh vực phổ 
bi n trong cuộc sống con ng i từ những 
năm hởi đầu ở th kỷ XIX. Dù ở mức độ 
chuyên nghiệp hay nghiệp d , ai cũng có 
thể d dàng tạo đ ợc một bức ảnh kỹ thuật 
số (từ đây, g i tắt là ảnh) bằng camera trên 
điện thoại hoặc máy ảnh, sau đó chỉnh sửa 
ảnh trực ti p tr n điện thoại hoặc chuyên 
sâu hơn, chỉnh sửa trên máy tính (Personal 
Computer) bằng các phần mềm chuyên 
dụng. M i chuyện sẽ hông có gì đ ng nói 
n u nh m i bức ảnh đều đ ợc sử dụng 
đúng với mục đích và chức năng của nó: 
truyền tải cho ng i nhìn thông tin ghi 
nhận lại trong th giới thực. Vấn đề nảy 
sinh khi một ng i dùng ảnh đã chỉnh sửa 
nh là một công cụ để khi n cho ng i xem 
tin vào thông điệp mà ng i đó muốn 
truyền tải. Hiện t ợng này dẫn tới nhu cầu 
sử dụng giải pháp khoa h c để gi m định 
tính chân thực trong nội dung hiển thị của 
ảnh. Hình 1 là ảnh giả từng đ ợc sử dụng 
trong truyền thông. 
 hông th ng, để bảo vệ tác quyền ảnh 
và xác thực nguồn gốc, kỹ thuật 
watermar ing hay signature đ ợc áp dụng 
vào trong ảnh. Từ đó, n u nội dung ảnh bị 
chỉnh sửa thì dữ liệu đ ợc mã hóa vào ảnh 
(vốn đ ợc xem là thông điệp nhận dạng 
mang tính bí mật) sẽ bị thay đổi. Việc xác 
thực ảnh đ ợc thực hiện bằng cách trích 
xuất ng ợc lại mã nhúng từ ảnh rồi kiểm tra 
mã này có t ơng ứng với mã mà ng i giữ 
bản gốc đang sở hữu hay hông Đây là 
c ch gi m định chủ động (active), khi mà 
ảnh gốc và ảnh giả đều sẵn có, hiện hữu. 
Mặt h c, th ng bức ảnh nhận đ ợc 
 hông đi èm với bất cứ thông tin bi t 
tr ớc nào Điều này dẫn tới c ch gi m định 
bị động (passive) hoặc phát hiện mù (blind 
detection). Với trạng thái bị động về nguồn 
tin, yêu cầu đặt ra là chỉ dựa vào bức ảnh 
đang có mà ta phải x c định liệu ảnh này có 
thật hay bị chỉnh sửa gì hay không. Với sự 
quan sát về bản chất rằng: mặc dù ảnh giả 
có thể hông để lại dấu v t trực quan cho 
mắt trần của con ng i nhận bi t dấu hiệu 
chỉnh sửa, nh ng ảnh đó có thể đã bị thay 
đổi về mặt số liệu thống kê ở mức giá trị 
pixel. Các thuộc tính thống kê này có thể 
đ ợc phân tách và trích l c để tạo thành các 
đặc tr ng giúp nhận bi t sự can thiệp về 
chỉnh sửa ảnh. Hình 2 cho thấy mức độ 
quan tâm trong lĩnh vực gi m định ảnh 
thông qua số l ợng bài báo công bố giai 
đoạn 2004 – 2013. 
 a) b) 
Hình 1: Ảnh ch p c u tổng th ng Pháp 
 z p gi i Tour de 
France: nh g c (a) và nh ch nh s a (b). 
[T p chí Le Parisien, 07/2015. 
www.fourandsix.com] 
Hình 2: S bài báo khoa h c IEEE và 
 c nh 
 nh s n 2004 - 2013. [23] 
Phần còn lại của bài vi t có bố cục nh 
5 
sau: mục II. trình bày các loại ảnh giả, mục 
III. và IV. phân loại các giải ph p gi m định 
theo h ớng Active và Passive, mục V. và VI. 
lần l ợt là các thách thức và ti u chí đ nh gi 
khi thực hiện gi m định ảnh, cuối cùng là 
thảo luận và k t luận ở mục VII. và VIII. 
2. Phân lo i nh gi 
A. Cloning 
Một phần của ảnh đ ợc sao chép và 
dán (clone) vào một nơi h c của cùng một 
ảnh ban đầu với mục đích là để che giấu 
hoặc tạo thêm chi ti t trong ảnh. Ví dụ điển 
hình đ ợc cho ở hình 3. 
 a) b) 
Hình 3: Ví d nh cloning. Ảnh g c (a) 
và nh gi (b) v i vùng nh hai con mèo 
 . [2] 
B. Splicing 
 ỹ thuật này giống cloning, ngoại trừ 
việc vùng ảnh sao chép đ ợc lấy từ nguồn 
ảnh h c b n ngoài Nói cách khác, 
splicing là tr ng hợp tổng qu t hơn 
cloning. ột ví dụ ảnh splicing đ ợc cho ở 
hình 4. 
Hình 4: Ả a, 
b) c). [7] 
C. Retouching 
Nâng cao chất l ợng ảnh (cân bằng 
trắng, đổi màu, tạo nhòe, v v ) th ng đ ợc 
 p dụng cho loại ảnh giả này để tăng c ng 
hay giảm bỏ c c chi ti t gốc. ột ví dụ 
đ ợc cho ở hình 5. 
 a) b) 
Hình 5: Ả 
 a) b): ú 
 ổ ê 
 ặ [35] 
D. Computer-Generated Imagery (CGI) 
Thay vì làm giả một phần, một bức ảnh 
có thể đ ợc làm giả hoàn toàn (không chụp 
bằng camera) nh các công cụ đồ h a trên 
máy tính. Một ví dụ đ ợc cho ở hình 6. 
Hình 6: Ví d v nh CGI. Ảnh g c 
(n a mặt trái) và nh gi (n a mặt ph i): 
h u n nh m khác 
bi t bằng m ờng. [22] 
3. ng ti p c n phát hi n nh gi 
- Active 
 rong ỹ thuật watermar ing, dữ liệu 
nhúng là thông tin đã đ ợc x c định tr ớc, 
nh là một ảnh biểu t ợng th ơng hiệu 
hoặc một đoạn văn bản au hi mã hóa 
thông tin vào ảnh, dữ liệu nhúng có thể 
đ ợc hiển thị tr n ảnh, hoặc cũng có thể để 
 6 
ẩn hoàn toàn, hoặc t hợp cả hai c ch 
(hình 7). Việc trích xuất lại watermar 
cũng có hai c ch: giải thuật có dùng thêm 
thông tin từ ảnh gốc (non-blind) và không 
dùng ảnh gốc (blind) rong hi ỹ thuật 
watermar ing thực hiện nhúng thông tin 
đ ợc ch n tr ớc vào ảnh, thì ỹ thuật 
signature thực hiện lấy đặc tr ng độc nhất 
từ ảnh rồi mã hóa thành dạng chữ ý số 
 a) b) 
Hình 7: a) 
(“ ” Africa Studio, 
www.shutterstock.com) và bán b) 
(“20 0 ©” Klaus Herrmann, 
 ó hai h ớng ti p cận: nhúng 
watermar trong miền hông gian và trong 
miền tần số Trong miền hông gian, ba ỹ 
thuật chính là Bit tr ng số thấp nhất (LSB) 
[8, 37], ập hối (Patchwork) [3] và ã dự 
đo n (Predictive coding) [39]. Ba ph ơng 
pháp trên, theo thứ tự t ơng ứng, rất nhạy 
với nhi u thay đổi tr n gi trị pixel (từ 
 nh truyền, phép xử lý hậu ỳ nh xoay, 
dịch và cắt ảnh), bị giới hạn l ợng thông 
tin nhúng và ém về mặt giữ nguy n chất 
l ợng ảnh, n n watermar miền tần số 
đ ợc quan tâm xem xét nhiều hơn nh 
 hắc phục đ ợc c c y u điểm này. 
Trong miền tần số, ba phép bi n đổi 
chính là Wavelet r i rạc - DWT, osine r i 
rạc - DCT và Fourier r i rạc - DFT. Bức 
ảnh đ ợc biểu di n d ới dạng tần số, vốn 
là đặc tính của tín hiệu nói chung, thông 
qua c c hệ số của miền bi n đổi. Thông tin 
mã nhúng đ ợc lồng vào c c hệ số này và 
 hi ti n hành x c minh, ta thực hiện phép 
bi n đổi ng ợc để t i tạo lại watermar đã 
dùng. Kỹ thuật watermar ing trải phổ [10] 
đ ợc sử dụng phố bi n và có nhiều thuật 
toán mới đ ợc đề xuất ph t triển; đồng 
th i, đây cũng là giải ph p mang tính bền 
vững cao 
Tiwari et al. [34] dùng bi n đổi DW 
hai mức cho ảnh gốc và dữ liệu nhúng 
đ ợc mã hóa DE (Data Encryption 
 tandard) tr ớc hi t hợp nhúng với ảnh 
gốc t quả là watermar chống chịu hiệu 
quả với phép nội suy hối nh ng vẫn giữ 
đ ợc chất l ợng ảnh ở hệ số chất l ợng QF 
lớn hơn 90 Jiansheng et al. [16] t hợp 
DW với D cho ra t quả watermar 
đ ợc ẩn hoàn toàn, đồng th i chống ch i 
đ ợc một số phép xử lý thông dụng nh 
l c, tăng c ng sắc nét, nhi u muối ti u, 
nén và cắt ảnh 
Những năm gần đây, c c h ớng 
nghi n cứu dựa trên ba loại bi n đổi cơ bản 
này vẫn đ ợc chú tr ng ph t triển. Pathak 
et al. [27] dùng lý thuy t to n huỗi hỗn 
loạn (Chaotic sequence) để trải phổ tín hiệu 
watermar vào c c hệ số DW , giúp giữ 
nguy n chất l ợng ảnh gốc (cải thiện chỉ số 
 NR) và tăng tính bền vững đối với c c 
phép bi n đổi nh phân t n dữ liệu nhúng 
tr n vùng phổ rộng và mang đặc tính giống 
nhi u (hình 8). Hu et al. [14] tăng c ng 
 hả năng chống chịu tấn công nén J E và 
thay đổi nhi u bằng c ch điều ch gi trị 
trung bình của hệ số D đổi dấu một 
phần ( A) có ph ơng sai điều chỉnh theo 
bảng l ợng tử J E hoặc chỉ số bi n dạng 
đ ng chú ý (JND) của mô hình ệ thống 
thị gi c con ng i ( V ) Su et al. [32] 
dùng phép bi n đổi mới hơn là ontourlet, 
 t hợp phép phân tích essenberg để 
nhúng watermar trong ảnh màu, t quả 
đạt tính vô hình cao hơn và hả năng 
chống ch i tốt hơn từ c c cuộc tấn công về 
7 
nén J E , l c tích chập và nhi u cộng 
Hình 8: w 
 W [40]. 
 ) Ả ú ) Ả 
w ) Ả w 
 . 
4. ng ti p c n phát hi n nh gi 
- Passive 
Hầu h t các kỹ thuật mù phát hiện ảnh 
giả đều có thể phân loại thành năm nhóm: 
dựa vào pixel, định dạng, máy ảnh và độ r i 
sáng (từ mục A. đ n D.). Ngoài ra, có một 
cách phân nhóm khác dựa trên loại đặc 
tr ng [30], n n năm nhóm trên có thể sắp 
x p lại thành hai nhóm lớn: dựa trên khối 
pixel và keypoint. 
A. Dựa vào pixel 
Các khối pixel, vốn là cơ sở hình thành 
nên ảnh số, đ ợc chú tr ng khảo s t để tìm 
sự h c th ng trong thống kê ở mức giá trị 
pixel, từ đó t luận về dấu v t chỉnh sửa 
của vùng ảnh giả. Trong công trình khởi 
đầu h ớng nghiên cứu gi m định ảnh, 
Fridrich et al. [11] đề xuất ph ơng ph p 
Exhausive Search cho ảnh cloning bằng 
cách tìm hai vùng chứa giá trị pixel giống 
nhau Đây là ph ơng ph p rất cơ bản và 
đơn giản nh ng hông đủ để dùng giám 
định ảnh giả thực t , đồng th i lại cần khối 
l ợng tính toán lớn au đó, công trình này 
còn đề xuất ph ơng ph p tối u hơn là 
Robust Match bằng cách dùng hệ số DCT 
thay vì giá trị pixel cho b ớc so sánh khối. 
 h ơng ph p này cho hiệu quả cao hơn 
nh ng vẫn còn vài giới hạn về độ tin cậy. 
Ngoài ra, ph ơng ph p này cũng hông bền 
vững tr ớc các phép bi n đổi tuy n tính. 
Bảng 1 thống kê k t quả đạt đ ợc 
t ơng ứng với các loại đặc tr ng khác nhau, 
thay vì dùng mức xám hay hệ số D nh 
đã phân tích ở đoạn tr ớc. Công trình tiêu 
biểu gần đây trong nhóm kỹ thuật này là 
Kaur và Walia [24] với việc sử dụng ớc 
l ợng nhi u và đặc tr ng về độ dốc có định 
h ớng biểu đồ tần suất ( O ) h ơng 
pháp này có khả năng đồng th i phát hiện 
và định vị vùng ảnh giả. K t quả (hình 9) 
đ ợc thử nghiệm trên tập dữ liệu CASIA. 
 a) Ảnh gốc b) Ảnh giả 
Hình 9: Phát hi nh v vùng nh 
gi trong hình b) dùng k 
thu Ư ng nhi ặ 
HOG [18]. 
B. Dự và định dạng ảnh 
 r ớc khi bị làm giả, ảnh đ ợc mở 
bằng phần mềm chỉnh sửa au đó, ảnh 
đ ợc l u mới và qua thêm một lần nén ảnh 
(ví dụ định dạng J E ) Để tận dụng tính 
chất nén không bảo toàn JPEG, có ba 
ph ơng ph p đ ợc đề xuất: 
1. Lượng tử JPEG 
 8 
B ng 1: So sánh k t qu n nh cloning [23] 
 h ơng ph p Đặc tr ng Bộ phân lớp Độ chính xác 
Popescu và 
Farid [28] 
PCA ắp x p theo thứ tự t n 
(lexicographic) 
100% hối pixel 16x16 
50% hối pixel nhỏ hơn 
Gopi et al.[13] ệ số tự hồi quy ạng nơron nhân tạo 94.83% 
Lin et al. [19] ng độ s ng trung 
bình của hối pixel 
 ắp x p theo cơ số và 
tính vector dịch 
98% 
Bashar et al. [1] DWT và KPCA huật to n ph t hiện 
nhân bản dựa theo điểm 
95.55% (DWT) 
90.94% (KCPA) 
Thajeel và Sulong [33] CR LBP ắp x p theo thứ tự t n > 91% (với phép xoay 
và phép xoay t hợp 
với phép bi n đổi khác) 
Isaac và Wilscy [15] Gabor Wavelet và 
l ợng tử pha cục bộ 
(LPQ) 
SVD 99% tr n tập dữ liệu 
CASIA v1.0 và tập màu 
DVMM 
Kaur và Walia [18] Ước l ợng nhi u 
dựa tr n A và đặc 
tr ng O 
Phân nhóm k-Means và 
SVM 
~70% cho tập dữ liệu 
CASIA v1.0 và v2.0 
Khi nén, mỗi hệ số DCT c đ ợc l ợng 
tử với hệ số q: c/q. Việc lựa ch n giá trị q 
khác nhau cho ra bảng l ợng tử khác nhau; 
do đó, một dạng chữ ý độc nhất về l ợng 
tử sẽ đ ợc nhúng vào ảnh JPEG ở đầu ra. 
2. Nén JPEG hơn một lần 
Phát hiện ảnh giả dựa trên hiện diện 
của nhi u (artifact) khi có nhiều hơn một 
lần nén ảnh. Giải pháp là phân tích tính chu 
kỳ lặp lại của nhi u l ợng tử đôi trong 
histogram sau khi ảnh bị nén từ lần thứ hai 
(hình 10). 
 a) b) 
Hình 10: K t qu phân tích nén JPEG và 
nhi ng t (b) t nh gi (a). Xem 
ngu n nh th t hình 3. [2] 
3. Nhiễu khối JPEG 
Phát hiện ảnh giả dựa trên sự bất đồng 
nhất trong nhi u khối. Giải pháp là tìm ma 
trận nhi u khối và quan sát phân lớp mẫu. 
Ảnh giả qua nhiều lần nén sẽ gây nhi u 
trong hai quan sát này. 
Lin và Tsay [21] dùng bộ ớc l ợng 
 ích th ớc khối nhi u (áp dụng kỹ thuật lấy 
mẫu ngẫu nhiên, bầu ch n và hợp lý cực 
đại - maximum likelihood) và phân tích 
tính nhất quán của ích th ớc khối nhi u 
JPEG (hình 11), khối cục bộ nào có kích 
th ớc khác với ích th ớc khối chính thì 
đ ợc xem là vùng ảnh giả. 
 a) Ảnh splicing. b) K t quả. 
Hình 11: Phát hi n nh Splicing dùng k 
thu Ư ng kh i nhi u [21]. 
9 
Tóm lại, những kỹ thuật này chỉ có lợi 
th trên bức ảnh đ ợc l u lại hơn một lần. 
Việc chỉ dùng mỗi thông tin về định dạng 
ảnh hông đủ để xây dựng ph ơng ph p 
phát hiện ảnh giả bền vững. Ngoài ra, n u 
chỉ dùng thông tin nén ảnh thì d dẫn đ n 
phát hiện sai, đơn cử là tr ng hợp ảnh gốc 
đ ợc phóng to theo thuật toán nội suy hoặc 
đ ợc làm nhòe, sau đó đ ợc l u lại Nh 
vậy, mặc dù nội dung ảnh hông thay đổi 
nh ng vẫn sẽ bị đ nh gi là ảnh giả, vì cũng 
có trải qua thêm một lần nén. 
C. Dựa vào máy ảnh 
Phân tích nhi u đ ợc tạo ra từ một hệ 
thống máy ảnh nhất định; từ đó, sự không 
nhất quán trong nhi u có thể đ ợc dùng để 
chỉ ra dấu v t chỉnh sửa ảnh. Có bốn cơ sở 
để áp dụng: h c th ng về màu sắc, Mảng 
l c màu, àm đ p ứng của máy ản ...  t ợng trong màu sắc 
 h c nhau dẫn tới sự hó hăn trong việc 
ph t hiện tất cả đối t ợng giả cùng một lúc 
Do đó, phần lớn công trình nghi n cứu gần 
đây tập trung vào sử dụng một phần hông 
gian màu để giới hạn loại đối t ợng xem 
xét, ví dụ nh chỉ xem xét đối t ợng màu 
da ng i [5]. 
Johnson và Farid [17] đã vận dụng t 
quả nghi n cứu Ước l ợng tự động h ớng 
nguồn s ng [25] để đ nh gi mức độ phản 
xạ cục bộ hoặc toàn cục tr n c c vùng ảnh 
có t cấu h c nhau (hình 13). Carvalho et 
al. [6] xây dựng mô hình 3 chiều của đối 
t ợng (chỉ từ một ảnh) tr ớc hi ớc l ợng 
h ớng nguồn s ng đ ợc đặt l n đối t ợng 
đó uy t quả hông đ ợc đ nh gi tr n 
một tập dữ liệu lớn, nh ng từ t quả thí 
nghiệm cho thấy ph ơng ph p này hiệu 
quả ngay cả với nguồn s ng phức tạp 
Mặc dù kỹ thuật phân tích h ớng 
nguồn sáng và thông tin màu rất hứa hẹn trở 
thành một công cụ gi m định ảnh hiệu quả, 
nh ng trong 5 năm trở lại đây, số l ợng 
công trình về h ớng nghiên cứu này vẫn 
còn rất ít so với c c h ớng ti p cận khác. 
 10 
 a) b) 
Hình 13: Ảnh giả (a) cho thấy góc ước 
lượng hướng ánh sáng cách biệt giữa hai 
người, 123o và 86o. Ảnh thật (b) cho thấy 
góc ước lượng hướng ánh sáng của hai 
người tương đương nhau, 98o và 93o. [17] 
 a) b) 
Hình 14: 
sáng (b) ờ 
 (a). [5] 
5. Các thách th c nh nh 
Cần x c định rõ các thách thức sẽ phải 
đối mặt trong việc phát hiện ảnh giả để l u 
ý các vấn đề cần giải quy t và đặt ra giả 
thuy t phù hợp trong quá trình nghiên cứu: 
 Giảm tỉ lệ phát hiện sai 
 Hoàn toàn tự động (không cần con 
ng i can thiệp để di n dịch k t quả) 
 Không phụ thuộc vào định dạng 
nguồn ảnh (nén ảnh) 
 ăng độ tin cậy và bền vững đối với 
bi n đổi tuy n tính và phi tuy n. 
 Tránh giới hạn số l ợng và kích 
th ớc của vùng ảnh giả có thể phát 
hiện đ ợc bởi thuật toán. 
 Tận dụng thông tin màu, thay vì chỉ 
dùng ảnh xám. 
 Tránh phát hiện sai c c đối t ợng thật 
có tính chất giống nhau hoặc đồng 
nhất tự nhiên (ví dụ: lốc các hộp sữa 
giống nhau, bầu tr i, mảng mây). 
 Có khả năng hoanh vùng và định 
vị vùng ảnh giả. 
 Loại bỏ các thông tin thừa khi tìm 
vùng ảnh giả: ví dụ nh chữ bìa báo 
trong hình 1. 
 Các thuật to n có dùng ng ỡng để 
phân loại k t quả th ng ch n giá 
trị ng ỡng cố định và mang tính 
kinh nghiệm. Cần xây dựng hàm lấy 
ng ỡng thích hợp có khả năng tùy 
bi n thích nghi và có mối liên hệ 
chặt chẽ với c c đặc tính đang xem 
xét của ảnh để tối u điểm lấy 
ng ỡng theo hàm mục ti u độ chính 
xác cực đại. 
Gần đây, Zerni e moments và lựa ch n 
bi n đổi tuy n tính t ơng đồng (SATS) 
đ ợc dùng cho phát hiện xoay [31, 9], SIFT 
cho xoay và tỉ lệ [26], SUFT cho xoay, tỉ lệ, 
nhi u cộng và nhòe [4], SVM cho phát hiện 
vùng nhòe [36]. Bi n đổi FMT thì bền vững 
đối với xoay, tỉ lệ, nhi u và nhòe với chi 
phí tính toán thấp. 
6. ê 
 Độ chính x c: ỉ lệ số lần ph t hiện 
đúng tr n tổng số ảnh giả đầu vào 
 hi phí tính to n: l ợng tính to n 
cần dùng để cho ra t quả, cần l u 
ý hi ứng dụng vào hệ thống th i 
gian thực 
 Độ nhạy với c c phép bi n đổi: chỉ 
ra mức độ t quả bị ảnh h ởng bởi 
c c điều iện thử nghiệm h c nhau. 
 Không nhạy với thay đổi của nhi u. 
 ức độ tự động: giảm thiểu can 
thiệp của con ng i trong việc di n 
dịch và đ a ra t luận gi m định. 
Độ chính x c n n là ti u chí hàng đầu, 
vì đây là t quả cuối cùng ảnh h ởng tới 
quy t định gi m định, nhất là hi liên quan 
tới luật pháp, còn các tiêu chí h c có thể 
11 
đ nh đổi qua lại Độ nhạy có thể đ ợc giới 
hạn ở một số hía cạnh và ứng dụng để 
ph ơng ph p đề ra có thể đ p ứng tốt một 
số mục ti u nhất định. 
 iệu năng có thể đ ợc biểu di n d ới 
dạng thống độ chính x c, độ nhạy và độ 
ri ng biệt Độ nhạy (Sensitivity) là thông 
số đo l ng độ chính x c phân loại đúng 
đối với ảnh giả (tức, ảnh giả đ ợc x p loại 
là giả), Độ ri ng biệt ( pecificity) đo l ng 
độ chính x c phân loại đúng đối với ảnh 
thực (tức, ảnh thực đ ợc x p loại là thực) 
và Độ chính x c (Accuracy) là tỉ lệ phần 
trăm giữa số ảnh phân loại đúng tr n tổng 
số ảnh xem xét (tức, ảnh giả đ ợc x p loại 
là giả và ảnh thực đ ợc x p loại là thực), 
tính nh (1): 
100
TP TN
Accuracy
TP TN FN FP
 (1) 
Với: 
 TP (True Positive): số ảnh giả đ ợc 
x p đúng là ảnh giả 
 FN (False Negative): số ảnh giả 
đ ợc x p sai thành ảnh thực 
 FP (False Positive): số ảnh thực 
đ ợc x p sai thành ảnh giả 
 TN (True Negative): số ảnh thực 
đ ợc x p đúng là ảnh thực 
7. l 
 rong hi ỹ thuật watermar và 
signature đ ợc dùng nh là công cụ chủ 
động để giúp chủ nhân của c c bức ảnh số 
bảo vệ quyền t c giả của mình, thì phần 
còn lại của câu chuyện gi m định ảnh là 
ph t hiện mù tr n những bức ảnh hông rõ 
nguồn gốc ớng ti p cận dựa vào độ r i 
sáng và không gian màu là ph ơng ph p 
ph t hiện hứa hẹn ph t triển nhất vì nó 
 hông phụ thuộc vào c c phép bi n đổi p 
dụng tr n vùng ảnh giả uy nhi n, h ớng 
ti p cận này cũng phải đối mặt với hó 
 hăn về định vị và hoanh vùng ảnh giả 
 r i lại, h ớng ti p cận dựa vào m y ảnh 
mang tính ém hả thi nhất vì nó y u cầu 
đ ợc bi t một số thông tin có tr ớc từ ảnh 
 hả nghi, điều mà vốn hông thể đạt đ ợc 
trong ứng dụng thực t hép bi n đổi nh 
D hay F ti p tục là ỹ thuật hiệu quả 
để biểu di n lại ảnh với ích th ớc nhỏ hơn 
(giảm thông tin d thừa) để giảm hối 
l ợng tính to n Ngoài ra, hai tập dữ liệu 
ảnh th ng dùng phổ bi n trong c c công 
trình gần đây đ ợc đ nh gi là đủ tốt để 
thử nghiệm và so s nh giữa c c ph ơng 
ph p, đó là o oFoD (từ phòng thí 
nghiệm Video ommunications, Đại h c 
Zagreb, roatia) và A IA (từ Viện ự 
động Nhận dạng ẫu, c việc hoa h c 
Quốc gia, rung Quốc) 
 ổng quan, nhiều ph ơng ph p đã 
đ ợc đề xuất để xử lý c c th ch thức trong 
ph t hiện ảnh giả, tuy nhi n chúng vẫn còn 
nhiều giới hạn về tính ứng dụng thực t 
 ột phần là vì có đặt tr ớc giới hạn trong 
giả thuy t ban đầu, một phần là vì thi u 
một mô hình chung và chuẩn hóa để hội tụ 
c c nh nh nghi n cứu còn đang ri ng lẻ 
Việc đ nh gi tính bền vững đối với c c 
loại phép bi n đổi đ ợc dùng tr n vùng ảnh 
giả vẫn dựa tr n thực nghiệm iểm chứng 
là chủ y u, n n nhu cầu về một mô hình 
to n h c hỗ trợ cho việc phân tích t quả 
cũng nh là dự đo n và ớc l ợng tr ớc 
tính bền vững của giải ph p (hay cụ thể là 
loại đặc tr ng) đ ợc đề xuất là cần thi t 
8. l n 
Bài hảo s t này đã tóm tắt phần lớn 
các h ớng nghi n cứu về lĩnh vực gi m 
định ảnh giả trong 15 năm gần đây, tập 
trung chủ y u vào h ớng ph t hiện mù 
 rong h ớng ti p cận chủ động, có hai ỹ 
thuật chính đ ợc dùng là watermar ing và 
signature; còn h ớng ti p cận bị động, có 
năm nhóm chính là dựa vào pixel, định 
 12 
dạng, m y ảnh và độ r i s ng ai ỹ thuật 
dựa vào hối pixel và eypoint cũng là một 
c ch phân loại h c Bài vi t cũng đã chỉ ra 
 u nh ợc điểm của mỗi nhóm phân loại 
Nhiều ỹ thuật đ ợc đ a ra cho thấy sự cải 
thiện lớn về độ chính x c l n tới 99%; tuy 
nhi n, th ng luôn có sự đ nh đổi giữa độ 
chính xác, mức phức tạp và độ bền vững 
trong giải thuật Ngoài ra, việc đối phó với 
c c phép bi n đổi tuy n tính cũng là một 
trong c c th ch thức lớn nhất trong việc 
xây dựng giải ph p mang tính bền vững, do 
sự đa dạng và tính t hợp của c c phép 
bi n đổi đ ợc dùng hi tạo ảnh giả. 
Lời c 
 ông trình này đ ợc tài trợ bởi quỹ Đại h c 
Quốc gia Thành phố Hồ Chí Minh với mã 
sốB2015-20-02. 
TÀI LIỆU THAM KHẢO 
1. Bashar, M., Noda, K., Ohnishi, N., và Mori, 
K. (2010). Exploring duplicated regions in 
natural images. IEEE Transactions on Image 
Processing, vol. PP, no. 99, pp. 1-1. 
2. Belkasoft, Belkasoft database. [Online]. 
Available: https://belkasoft.com/forgery-detection 
3. Bender, W., Gruhl, D., Morimoto, N., và Lu, 
A. (1996). Techniques for data hiding. IBM 
systems journal, 35(3.4), pp. 313-336. 
4. Bo, X., Junwen, W., Guangjie, L., và Yuewei, D. 
(2010). Image copymove forgery detection based 
on surf. In Multimedia Information Networking 
and Security (MINES), 2010 International 
Conference on, pages 889-892. IEEE. 
5. Carvalho, T. J. d., Riess, C., Angelopoulou, 
E., Pedrini, H., và de Rezende Rocha, A. 
(2013). Exposing digital image forgeries by 
illumination color classification. Information 
Forensics and Security, IEEE Transactions 
on, 8(7):1182-1194. 
6. Carvalho, Tiago, Hany Farid, và Eric Kee. 
(2015). Exposing photo manipulation from 
user-guided 3D lighting analysis. SPIE/IS&T 
Electronic Imaging. International Society for 
Optics and Photonics. 
7. CASIA. Tampering detection dataset. [Online]. 
Available:  
8. Chang, C. C., Hsiao, J. Y., và Chan, C. S. 
(2003). Finding optimal least-significant-bit 
substitution in image hiding by dynamic 
programming strategy. Pattern Recognition, 
36(7), 1583-1595. 
9. Christlein, V., Riess, C., và Angelopoulou, E. 
(2010). On rotation invariance in copy-move 
forgery detection. In Information Forensics 
and Security (WIFS), 2010 IEEE International 
Workshop on, pages 1-6. IEEE. 
10. Cox, I. J., Kilian, J., Leighton, F. T., và 
Shamoon, T. (1997). Secure spread spectrum 
watermarking for multimedia. IEEE 
Transactions on Image Processing, 
6(12):1673-1687. 
11. Fridrich, A. J., Soukal, B. D., và u š, A. J. 
(2003). Detection of copy-move forgery in 
digital images. In in Proceedings of Digital 
Forensic Research Workshop. Citeseer. 
12. Fridrich, J. (2009). Digital image forensics. 
Signal Processing Magazine, IEEE, 26(2):26-37. 
13. Gopi, E., Lakshmanan, N., Gokul, T., Kumara 
Ganesh, S., và Shah, P. R. (2006). Digital 
image forgery detection using artificial neural 
network and auto regressive coefficients. In 
Electrical and Computer Engineering, 2006. 
 E E’06 anadian onference on, pages 
194-197. IEEE. 
14. Hu, H. T., Chang, J. R., và Hsu, L. Y. (2016). 
Robust blind image watermarking by 
modulating the mean of partly sign-altered 
DCT coefficients guided by human visual 
perception. AEU-International Journal of 
Electronics and Communications. 
15. Isaac, M. M., và Wilscy, M. (2015). Image 
Forgery Detection Based on Gabor Wavelets 
and Local Phase Quantization. Procedia 
Computer Science, 58, 76-83. 
16. Jiansheng, M., Sukang, L., và Xiaomei, T. 
(2009). A digital watermarking algorithm 
based on DCT and DWT. In Proceedings of 
the 2009 International Symposium on Web 
Information Systems and Applications 
(WI A’09) Nanchang, R hina, pages 
104-107. Citeseer. 
17. Johnson, Micah K., và Hany Farid. (2005) 
Exposing digital forgeries by detecting 
inconsistencies in lighting. Proceedings of the 
7th workshop on Multimedia and security. 
ACM. 
18. Kaur, M., và Walia, S. (2016). Forgery 
Detection Using Noise Estimation and HOG 
Feature Extraction. International Journal of 
13 
Multimedia and Ubiquitous Engineering, 
11(4), 37-48. 
19. Lin, H.-J., Wang, C.-W., Kao, Y.-T., và Chen, 
S. (2009a). An efficient method for copy-move 
forgery detection. In WSEAS International 
Conference. Proceedings. Mathematics and 
Computers in Science and Engineering, 
number 8. World Scientific and Engineering 
Academy and Society. 
20. Lin, H.-J., Wang, C.-W., Kao, Y.-T., et al. 
(2009b). Fast copy-move forgery detection. 
WSEAS Transactions on Signal Processing, 
5(5): 188-197. 
21. Lin, C. S., và Tsay, J. J. (2015). Passive 
forgery detection for JPEG compressed image 
based on block size estimation and 
consistency analysis. Applied Mathematics 
and Information Sciences, 9(2), 1015. 
22. Luxion. Keyshot program. [Online]. 
Available: https://www.keyshot.com 
23. Mushtaq, S. và Mir, A. H. (2014). Digital 
image forgeries and passive image 
authentication techniques: A survey. 
International Journal of Advanced Science 
and Technology, 73:15–32. 
24. Myrna, A., Venkateshmurthy, M., và Patil, C. 
(2007). Detection of region duplication 
forgery in digital images using wavelets and 
log-polar mapping. In Conference on 
Computational Intelligence and Multimedia 
Applications, 2007. International Conference 
on, volume 3, pages 371-377. IEEE. 
25. Nillius, Peter, và Jan-Olof Eklundh. (2001). 
Automatic estimation of the projected light 
source direction. Computer Vision and 
Pattern Recognition, 2001. CVPR 2001. 
Proceedings of the 2001 IEEE Computer 
Society Conference on. Vol. 1. IEEE. 
26. Pan, X. và Lyu, S. (2010). Detecting image 
region duplication using sift features. In 
ICASSP, pages 1706–1709. 
27. Pathak, S., Tiwari, S., và Agrawal, S. (2016). 
Digital image watermarking in Wavelet 
domain using chaotic. Futuristic Trends in 
Engineering, Science, Humanities, and 
Technology FTESHT-16, 108. 
28. Popescu, A. và Farid, H. (2004). Exposing 
digital forgeries by detecting duplicated 
image region [technical report]. 2004-515. 
Hanover, Department of Computer Science, 
Dartmouth College. USA. 
29. Qazi, T., Hayat, K., Khan, S. U., Madani, S. 
A., Khan, I. A., Ko lodziej, J., Li, H., Lin, W., 
Yow, K., và Xu, C.-Z. (2013). Survey on 
blind image forgery detection. Image 
Processing, IET, 7(7):660-670. 
30. Rajkumar, R., Chanu, T. A., và Singh, N. N. 
(2016). Copy move forgery detection 
approaches: A survey. ADBU Journal of 
Engineering Technology, 
31. Ryu, S.-J., Lee, M.-J., và Lee, H.-K. (2010). 
Detection of copy-rotatemove forgery using 
zernike moments. In Information Hiding, 
pages 51–65. Springer. 
32. Su, Q., Wang, G., Lv, G., Zhang, X., Deng, 
G., và Chen, B. (2016). A novel blind color 
image watermarking based on Contourlet 
transform and Hessenberg decomposition. 
Multimedia Tools and Applications, 1-21. 
33. Thajeel, S. A. N., và Sulong, G. (2015). A 
novel approach for detection of copy move 
forgery using completed robust local binary 
pattern. Journal of Information Hiding and 
Multimedia Signal Processing, 6(2), 351-364. 
34. Tiwari, N., Ramaiya, M. K., và Sharma, M. 
(2013). Digital watermarking using DWT and 
DES. In Advance Computing Conference 
(IACC), 2013 IEEE 3rd International, pages 
1100–1102. 
35. Unknown. Retouching image. [Online]. 
Available: 
www.retouchingphotos.wikispaces.com 
36. Wang, B., Kong, X., Bertino, E., và Fu, H. 
(2009). Exposing copypasteblur forgeries 
based on color coherence. Chinese Journal of 
Electronics, 18(3):487-490. 
37. Wang, R. Z., Lin, C. F., và Lin, J. C. (2001). 
Image hiding by optimal LSB substitution and 
genetic algorithm. Pattern recognition, 34(3), 
671-683. 
38. Yang, R., Bai, Z., Yin, L., và Gao, H. (2015). 
Detecting of copy-move forgery in digital 
images using fractional Fourier transform. In 
Seventh International Conference on Digital 
Image Processing (ICDIP15) (pp. 96310B-
96310B). International Society for Optics and 
Photonics. 
39. Yu, Y. H., Chang, C. C., và Hu, Y. C. (2005). 
Hiding secret data in images via predictive 
coding. Pattern Recognition, 38(5), 691-705. 
Ngày nhận bài: 30/8/2016 Biên tập xong: 15/9/2016 Duyệt đăng: 20/9/2016 

File đính kèm:

  • pdfnhung_phuong_phap_tiep_can_ve_ky_thuat_giam_dinh_anh_so.pdf