Những phương pháp tiếp cận về kỹ thuật giám định ảnh số
Một bức ảnh số có thể d dàng đ ợc chỉnh sửa về mặt hiển thị nh vào các phần mềm chỉnh sửa ảnh
nhất định ơ sở của việc gi m định tính chân thực của ảnh là mặc dù ảnh giả có thể hông để lại bất kỳ
dấu v t hay điểm bất th ng gì báo hiệu đã qua chỉnh sửa, nh ng có thể đặc tính thống kê pixel trên ảnh
đã bị thay đổi. Bài vi t này là một tổng quan về ph ơng ph p gi m định ảnh số, chú tr ng vào ph ơng
pháp phát hiện mù từ công trình khởi đầu của Fridrich năm 2003 đ n các công trình mới trong nửa đầu
năm 2016 Hầu h t c c ph ơng ph p hiện tại đều đ ợc x p vào các nhóm phân loại và đ ợc phân tích đi
kèm với nhận xét và trích dẫn từ tác giả. Bài vi t cũng đề ra thách thức và tiêu chí đ nh gi trong việc
gi m định ảnh giả, từ đó làm cơ sở để phân tích và so sánh giữa c c ph ơng ph p h c nhau
Tóm tắt nội dung tài liệu: Những phương pháp tiếp cận về kỹ thuật giám định ảnh số
TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 20 (45) - Thaùng 9/2016 3 Những phương pháp tiếp cận về kỹ thuật giám định ảnh số Approaches to techniques of digital image forensics han r ng i n h ng r ng Đại h c B ch hoa Phan Trong Le, BEng. Le Tien Thuong, Assoc.Prof.,Ph.D. Ho Chi Minh City University of Technology Tóm t t Một bức ảnh số có thể d dàng đ ợc chỉnh sửa về mặt hiển thị nh vào các phần mềm chỉnh sửa ảnh nhất định ơ sở của việc gi m định tính chân thực của ảnh là mặc dù ảnh giả có thể hông để lại bất kỳ dấu v t hay điểm bất th ng gì báo hiệu đã qua chỉnh sửa, nh ng có thể đặc tính thống kê pixel trên ảnh đã bị thay đổi. Bài vi t này là một tổng quan về ph ơng ph p gi m định ảnh số, chú tr ng vào ph ơng pháp phát hiện mù từ công trình khởi đầu của Fridrich năm 2003 đ n các công trình mới trong nửa đầu năm 2016 Hầu h t c c ph ơng ph p hiện tại đều đ ợc x p vào các nhóm phân loại và đ ợc phân tích đi kèm với nhận xét và trích dẫn từ tác giả. Bài vi t cũng đề ra thách thức và tiêu chí đ nh gi trong việc gi m định ảnh giả, từ đó làm cơ sở để phân tích và so sánh giữa c c ph ơng ph p h c nhau Từ khóa: phát hiện ảnh giả, pháp chứng, kỹ thuật watermarking, chữ ký signature, ảnh cloning, splicing, retouching, ảnh tạo hoàn toàn từ máy tính (CGI), biến đổi cosine rời rạc (DCT), phân tích thành phần chính (PCA), máy vector hỗ trợ (SVM). Abstract A digital image can be visually changed with ease by using certain editing software. A foundation on which we are relying is the assumption that although digital forgeries may leave no visual evidences indicating the tampering, they may have altered the statistical properties of pixel values in the image. This paper is a literature review on digital image forgery detection focusing on blind detection approach, from the very beginning work of Fridrich in 2003 to the recent ones in the first half of 2016. Most of the proposed methods are well classified into categories and analyzed with comments and citations. This work also indicates the vital challenges and criteria of performance evaluation to the detection of forgery images, which are considered as the basis of comparison between different methods. Keywords: digital image forgery, forensics, watermarking, signature, copy-move, splicing or retouching image, computer-generated imagery (CGI), affine transform, discrete cosine transform (DCT), discrete wavelet transform (DWT), principal component analysis (PCA), support vector machine (SVM). 4 1. ặt v v k thu t nh nh s Nhi p ảnh dần trở thành lĩnh vực phổ bi n trong cuộc sống con ng i từ những năm hởi đầu ở th kỷ XIX. Dù ở mức độ chuyên nghiệp hay nghiệp d , ai cũng có thể d dàng tạo đ ợc một bức ảnh kỹ thuật số (từ đây, g i tắt là ảnh) bằng camera trên điện thoại hoặc máy ảnh, sau đó chỉnh sửa ảnh trực ti p tr n điện thoại hoặc chuyên sâu hơn, chỉnh sửa trên máy tính (Personal Computer) bằng các phần mềm chuyên dụng. M i chuyện sẽ hông có gì đ ng nói n u nh m i bức ảnh đều đ ợc sử dụng đúng với mục đích và chức năng của nó: truyền tải cho ng i nhìn thông tin ghi nhận lại trong th giới thực. Vấn đề nảy sinh khi một ng i dùng ảnh đã chỉnh sửa nh là một công cụ để khi n cho ng i xem tin vào thông điệp mà ng i đó muốn truyền tải. Hiện t ợng này dẫn tới nhu cầu sử dụng giải pháp khoa h c để gi m định tính chân thực trong nội dung hiển thị của ảnh. Hình 1 là ảnh giả từng đ ợc sử dụng trong truyền thông. hông th ng, để bảo vệ tác quyền ảnh và xác thực nguồn gốc, kỹ thuật watermar ing hay signature đ ợc áp dụng vào trong ảnh. Từ đó, n u nội dung ảnh bị chỉnh sửa thì dữ liệu đ ợc mã hóa vào ảnh (vốn đ ợc xem là thông điệp nhận dạng mang tính bí mật) sẽ bị thay đổi. Việc xác thực ảnh đ ợc thực hiện bằng cách trích xuất ng ợc lại mã nhúng từ ảnh rồi kiểm tra mã này có t ơng ứng với mã mà ng i giữ bản gốc đang sở hữu hay hông Đây là c ch gi m định chủ động (active), khi mà ảnh gốc và ảnh giả đều sẵn có, hiện hữu. Mặt h c, th ng bức ảnh nhận đ ợc hông đi èm với bất cứ thông tin bi t tr ớc nào Điều này dẫn tới c ch gi m định bị động (passive) hoặc phát hiện mù (blind detection). Với trạng thái bị động về nguồn tin, yêu cầu đặt ra là chỉ dựa vào bức ảnh đang có mà ta phải x c định liệu ảnh này có thật hay bị chỉnh sửa gì hay không. Với sự quan sát về bản chất rằng: mặc dù ảnh giả có thể hông để lại dấu v t trực quan cho mắt trần của con ng i nhận bi t dấu hiệu chỉnh sửa, nh ng ảnh đó có thể đã bị thay đổi về mặt số liệu thống kê ở mức giá trị pixel. Các thuộc tính thống kê này có thể đ ợc phân tách và trích l c để tạo thành các đặc tr ng giúp nhận bi t sự can thiệp về chỉnh sửa ảnh. Hình 2 cho thấy mức độ quan tâm trong lĩnh vực gi m định ảnh thông qua số l ợng bài báo công bố giai đoạn 2004 – 2013. a) b) Hình 1: Ảnh ch p c u tổng th ng Pháp z p gi i Tour de France: nh g c (a) và nh ch nh s a (b). [T p chí Le Parisien, 07/2015. www.fourandsix.com] Hình 2: S bài báo khoa h c IEEE và c nh nh s n 2004 - 2013. [23] Phần còn lại của bài vi t có bố cục nh 5 sau: mục II. trình bày các loại ảnh giả, mục III. và IV. phân loại các giải ph p gi m định theo h ớng Active và Passive, mục V. và VI. lần l ợt là các thách thức và ti u chí đ nh gi khi thực hiện gi m định ảnh, cuối cùng là thảo luận và k t luận ở mục VII. và VIII. 2. Phân lo i nh gi A. Cloning Một phần của ảnh đ ợc sao chép và dán (clone) vào một nơi h c của cùng một ảnh ban đầu với mục đích là để che giấu hoặc tạo thêm chi ti t trong ảnh. Ví dụ điển hình đ ợc cho ở hình 3. a) b) Hình 3: Ví d nh cloning. Ảnh g c (a) và nh gi (b) v i vùng nh hai con mèo . [2] B. Splicing ỹ thuật này giống cloning, ngoại trừ việc vùng ảnh sao chép đ ợc lấy từ nguồn ảnh h c b n ngoài Nói cách khác, splicing là tr ng hợp tổng qu t hơn cloning. ột ví dụ ảnh splicing đ ợc cho ở hình 4. Hình 4: Ả a, b) c). [7] C. Retouching Nâng cao chất l ợng ảnh (cân bằng trắng, đổi màu, tạo nhòe, v v ) th ng đ ợc p dụng cho loại ảnh giả này để tăng c ng hay giảm bỏ c c chi ti t gốc. ột ví dụ đ ợc cho ở hình 5. a) b) Hình 5: Ả a) b): ú ổ ê ặ [35] D. Computer-Generated Imagery (CGI) Thay vì làm giả một phần, một bức ảnh có thể đ ợc làm giả hoàn toàn (không chụp bằng camera) nh các công cụ đồ h a trên máy tính. Một ví dụ đ ợc cho ở hình 6. Hình 6: Ví d v nh CGI. Ảnh g c (n a mặt trái) và nh gi (n a mặt ph i): h u n nh m khác bi t bằng m ờng. [22] 3. ng ti p c n phát hi n nh gi - Active rong ỹ thuật watermar ing, dữ liệu nhúng là thông tin đã đ ợc x c định tr ớc, nh là một ảnh biểu t ợng th ơng hiệu hoặc một đoạn văn bản au hi mã hóa thông tin vào ảnh, dữ liệu nhúng có thể đ ợc hiển thị tr n ảnh, hoặc cũng có thể để 6 ẩn hoàn toàn, hoặc t hợp cả hai c ch (hình 7). Việc trích xuất lại watermar cũng có hai c ch: giải thuật có dùng thêm thông tin từ ảnh gốc (non-blind) và không dùng ảnh gốc (blind) rong hi ỹ thuật watermar ing thực hiện nhúng thông tin đ ợc ch n tr ớc vào ảnh, thì ỹ thuật signature thực hiện lấy đặc tr ng độc nhất từ ảnh rồi mã hóa thành dạng chữ ý số a) b) Hình 7: a) (“ ” Africa Studio, www.shutterstock.com) và bán b) (“20 0 ©” Klaus Herrmann, ó hai h ớng ti p cận: nhúng watermar trong miền hông gian và trong miền tần số Trong miền hông gian, ba ỹ thuật chính là Bit tr ng số thấp nhất (LSB) [8, 37], ập hối (Patchwork) [3] và ã dự đo n (Predictive coding) [39]. Ba ph ơng pháp trên, theo thứ tự t ơng ứng, rất nhạy với nhi u thay đổi tr n gi trị pixel (từ nh truyền, phép xử lý hậu ỳ nh xoay, dịch và cắt ảnh), bị giới hạn l ợng thông tin nhúng và ém về mặt giữ nguy n chất l ợng ảnh, n n watermar miền tần số đ ợc quan tâm xem xét nhiều hơn nh hắc phục đ ợc c c y u điểm này. Trong miền tần số, ba phép bi n đổi chính là Wavelet r i rạc - DWT, osine r i rạc - DCT và Fourier r i rạc - DFT. Bức ảnh đ ợc biểu di n d ới dạng tần số, vốn là đặc tính của tín hiệu nói chung, thông qua c c hệ số của miền bi n đổi. Thông tin mã nhúng đ ợc lồng vào c c hệ số này và hi ti n hành x c minh, ta thực hiện phép bi n đổi ng ợc để t i tạo lại watermar đã dùng. Kỹ thuật watermar ing trải phổ [10] đ ợc sử dụng phố bi n và có nhiều thuật toán mới đ ợc đề xuất ph t triển; đồng th i, đây cũng là giải ph p mang tính bền vững cao Tiwari et al. [34] dùng bi n đổi DW hai mức cho ảnh gốc và dữ liệu nhúng đ ợc mã hóa DE (Data Encryption tandard) tr ớc hi t hợp nhúng với ảnh gốc t quả là watermar chống chịu hiệu quả với phép nội suy hối nh ng vẫn giữ đ ợc chất l ợng ảnh ở hệ số chất l ợng QF lớn hơn 90 Jiansheng et al. [16] t hợp DW với D cho ra t quả watermar đ ợc ẩn hoàn toàn, đồng th i chống ch i đ ợc một số phép xử lý thông dụng nh l c, tăng c ng sắc nét, nhi u muối ti u, nén và cắt ảnh Những năm gần đây, c c h ớng nghi n cứu dựa trên ba loại bi n đổi cơ bản này vẫn đ ợc chú tr ng ph t triển. Pathak et al. [27] dùng lý thuy t to n huỗi hỗn loạn (Chaotic sequence) để trải phổ tín hiệu watermar vào c c hệ số DW , giúp giữ nguy n chất l ợng ảnh gốc (cải thiện chỉ số NR) và tăng tính bền vững đối với c c phép bi n đổi nh phân t n dữ liệu nhúng tr n vùng phổ rộng và mang đặc tính giống nhi u (hình 8). Hu et al. [14] tăng c ng hả năng chống chịu tấn công nén J E và thay đổi nhi u bằng c ch điều ch gi trị trung bình của hệ số D đổi dấu một phần ( A) có ph ơng sai điều chỉnh theo bảng l ợng tử J E hoặc chỉ số bi n dạng đ ng chú ý (JND) của mô hình ệ thống thị gi c con ng i ( V ) Su et al. [32] dùng phép bi n đổi mới hơn là ontourlet, t hợp phép phân tích essenberg để nhúng watermar trong ảnh màu, t quả đạt tính vô hình cao hơn và hả năng chống ch i tốt hơn từ c c cuộc tấn công về 7 nén J E , l c tích chập và nhi u cộng Hình 8: w W [40]. ) Ả ú ) Ả w ) Ả w . 4. ng ti p c n phát hi n nh gi - Passive Hầu h t các kỹ thuật mù phát hiện ảnh giả đều có thể phân loại thành năm nhóm: dựa vào pixel, định dạng, máy ảnh và độ r i sáng (từ mục A. đ n D.). Ngoài ra, có một cách phân nhóm khác dựa trên loại đặc tr ng [30], n n năm nhóm trên có thể sắp x p lại thành hai nhóm lớn: dựa trên khối pixel và keypoint. A. Dựa vào pixel Các khối pixel, vốn là cơ sở hình thành nên ảnh số, đ ợc chú tr ng khảo s t để tìm sự h c th ng trong thống kê ở mức giá trị pixel, từ đó t luận về dấu v t chỉnh sửa của vùng ảnh giả. Trong công trình khởi đầu h ớng nghiên cứu gi m định ảnh, Fridrich et al. [11] đề xuất ph ơng ph p Exhausive Search cho ảnh cloning bằng cách tìm hai vùng chứa giá trị pixel giống nhau Đây là ph ơng ph p rất cơ bản và đơn giản nh ng hông đủ để dùng giám định ảnh giả thực t , đồng th i lại cần khối l ợng tính toán lớn au đó, công trình này còn đề xuất ph ơng ph p tối u hơn là Robust Match bằng cách dùng hệ số DCT thay vì giá trị pixel cho b ớc so sánh khối. h ơng ph p này cho hiệu quả cao hơn nh ng vẫn còn vài giới hạn về độ tin cậy. Ngoài ra, ph ơng ph p này cũng hông bền vững tr ớc các phép bi n đổi tuy n tính. Bảng 1 thống kê k t quả đạt đ ợc t ơng ứng với các loại đặc tr ng khác nhau, thay vì dùng mức xám hay hệ số D nh đã phân tích ở đoạn tr ớc. Công trình tiêu biểu gần đây trong nhóm kỹ thuật này là Kaur và Walia [24] với việc sử dụng ớc l ợng nhi u và đặc tr ng về độ dốc có định h ớng biểu đồ tần suất ( O ) h ơng pháp này có khả năng đồng th i phát hiện và định vị vùng ảnh giả. K t quả (hình 9) đ ợc thử nghiệm trên tập dữ liệu CASIA. a) Ảnh gốc b) Ảnh giả Hình 9: Phát hi nh v vùng nh gi trong hình b) dùng k thu Ư ng nhi ặ HOG [18]. B. Dự và định dạng ảnh r ớc khi bị làm giả, ảnh đ ợc mở bằng phần mềm chỉnh sửa au đó, ảnh đ ợc l u mới và qua thêm một lần nén ảnh (ví dụ định dạng J E ) Để tận dụng tính chất nén không bảo toàn JPEG, có ba ph ơng ph p đ ợc đề xuất: 1. Lượng tử JPEG 8 B ng 1: So sánh k t qu n nh cloning [23] h ơng ph p Đặc tr ng Bộ phân lớp Độ chính xác Popescu và Farid [28] PCA ắp x p theo thứ tự t n (lexicographic) 100% hối pixel 16x16 50% hối pixel nhỏ hơn Gopi et al.[13] ệ số tự hồi quy ạng nơron nhân tạo 94.83% Lin et al. [19] ng độ s ng trung bình của hối pixel ắp x p theo cơ số và tính vector dịch 98% Bashar et al. [1] DWT và KPCA huật to n ph t hiện nhân bản dựa theo điểm 95.55% (DWT) 90.94% (KCPA) Thajeel và Sulong [33] CR LBP ắp x p theo thứ tự t n > 91% (với phép xoay và phép xoay t hợp với phép bi n đổi khác) Isaac và Wilscy [15] Gabor Wavelet và l ợng tử pha cục bộ (LPQ) SVD 99% tr n tập dữ liệu CASIA v1.0 và tập màu DVMM Kaur và Walia [18] Ước l ợng nhi u dựa tr n A và đặc tr ng O Phân nhóm k-Means và SVM ~70% cho tập dữ liệu CASIA v1.0 và v2.0 Khi nén, mỗi hệ số DCT c đ ợc l ợng tử với hệ số q: c/q. Việc lựa ch n giá trị q khác nhau cho ra bảng l ợng tử khác nhau; do đó, một dạng chữ ý độc nhất về l ợng tử sẽ đ ợc nhúng vào ảnh JPEG ở đầu ra. 2. Nén JPEG hơn một lần Phát hiện ảnh giả dựa trên hiện diện của nhi u (artifact) khi có nhiều hơn một lần nén ảnh. Giải pháp là phân tích tính chu kỳ lặp lại của nhi u l ợng tử đôi trong histogram sau khi ảnh bị nén từ lần thứ hai (hình 10). a) b) Hình 10: K t qu phân tích nén JPEG và nhi ng t (b) t nh gi (a). Xem ngu n nh th t hình 3. [2] 3. Nhiễu khối JPEG Phát hiện ảnh giả dựa trên sự bất đồng nhất trong nhi u khối. Giải pháp là tìm ma trận nhi u khối và quan sát phân lớp mẫu. Ảnh giả qua nhiều lần nén sẽ gây nhi u trong hai quan sát này. Lin và Tsay [21] dùng bộ ớc l ợng ích th ớc khối nhi u (áp dụng kỹ thuật lấy mẫu ngẫu nhiên, bầu ch n và hợp lý cực đại - maximum likelihood) và phân tích tính nhất quán của ích th ớc khối nhi u JPEG (hình 11), khối cục bộ nào có kích th ớc khác với ích th ớc khối chính thì đ ợc xem là vùng ảnh giả. a) Ảnh splicing. b) K t quả. Hình 11: Phát hi n nh Splicing dùng k thu Ư ng kh i nhi u [21]. 9 Tóm lại, những kỹ thuật này chỉ có lợi th trên bức ảnh đ ợc l u lại hơn một lần. Việc chỉ dùng mỗi thông tin về định dạng ảnh hông đủ để xây dựng ph ơng ph p phát hiện ảnh giả bền vững. Ngoài ra, n u chỉ dùng thông tin nén ảnh thì d dẫn đ n phát hiện sai, đơn cử là tr ng hợp ảnh gốc đ ợc phóng to theo thuật toán nội suy hoặc đ ợc làm nhòe, sau đó đ ợc l u lại Nh vậy, mặc dù nội dung ảnh hông thay đổi nh ng vẫn sẽ bị đ nh gi là ảnh giả, vì cũng có trải qua thêm một lần nén. C. Dựa vào máy ảnh Phân tích nhi u đ ợc tạo ra từ một hệ thống máy ảnh nhất định; từ đó, sự không nhất quán trong nhi u có thể đ ợc dùng để chỉ ra dấu v t chỉnh sửa ảnh. Có bốn cơ sở để áp dụng: h c th ng về màu sắc, Mảng l c màu, àm đ p ứng của máy ản ... t ợng trong màu sắc h c nhau dẫn tới sự hó hăn trong việc ph t hiện tất cả đối t ợng giả cùng một lúc Do đó, phần lớn công trình nghi n cứu gần đây tập trung vào sử dụng một phần hông gian màu để giới hạn loại đối t ợng xem xét, ví dụ nh chỉ xem xét đối t ợng màu da ng i [5]. Johnson và Farid [17] đã vận dụng t quả nghi n cứu Ước l ợng tự động h ớng nguồn s ng [25] để đ nh gi mức độ phản xạ cục bộ hoặc toàn cục tr n c c vùng ảnh có t cấu h c nhau (hình 13). Carvalho et al. [6] xây dựng mô hình 3 chiều của đối t ợng (chỉ từ một ảnh) tr ớc hi ớc l ợng h ớng nguồn s ng đ ợc đặt l n đối t ợng đó uy t quả hông đ ợc đ nh gi tr n một tập dữ liệu lớn, nh ng từ t quả thí nghiệm cho thấy ph ơng ph p này hiệu quả ngay cả với nguồn s ng phức tạp Mặc dù kỹ thuật phân tích h ớng nguồn sáng và thông tin màu rất hứa hẹn trở thành một công cụ gi m định ảnh hiệu quả, nh ng trong 5 năm trở lại đây, số l ợng công trình về h ớng nghiên cứu này vẫn còn rất ít so với c c h ớng ti p cận khác. 10 a) b) Hình 13: Ảnh giả (a) cho thấy góc ước lượng hướng ánh sáng cách biệt giữa hai người, 123o và 86o. Ảnh thật (b) cho thấy góc ước lượng hướng ánh sáng của hai người tương đương nhau, 98o và 93o. [17] a) b) Hình 14: sáng (b) ờ (a). [5] 5. Các thách th c nh nh Cần x c định rõ các thách thức sẽ phải đối mặt trong việc phát hiện ảnh giả để l u ý các vấn đề cần giải quy t và đặt ra giả thuy t phù hợp trong quá trình nghiên cứu: Giảm tỉ lệ phát hiện sai Hoàn toàn tự động (không cần con ng i can thiệp để di n dịch k t quả) Không phụ thuộc vào định dạng nguồn ảnh (nén ảnh) ăng độ tin cậy và bền vững đối với bi n đổi tuy n tính và phi tuy n. Tránh giới hạn số l ợng và kích th ớc của vùng ảnh giả có thể phát hiện đ ợc bởi thuật toán. Tận dụng thông tin màu, thay vì chỉ dùng ảnh xám. Tránh phát hiện sai c c đối t ợng thật có tính chất giống nhau hoặc đồng nhất tự nhiên (ví dụ: lốc các hộp sữa giống nhau, bầu tr i, mảng mây). Có khả năng hoanh vùng và định vị vùng ảnh giả. Loại bỏ các thông tin thừa khi tìm vùng ảnh giả: ví dụ nh chữ bìa báo trong hình 1. Các thuật to n có dùng ng ỡng để phân loại k t quả th ng ch n giá trị ng ỡng cố định và mang tính kinh nghiệm. Cần xây dựng hàm lấy ng ỡng thích hợp có khả năng tùy bi n thích nghi và có mối liên hệ chặt chẽ với c c đặc tính đang xem xét của ảnh để tối u điểm lấy ng ỡng theo hàm mục ti u độ chính xác cực đại. Gần đây, Zerni e moments và lựa ch n bi n đổi tuy n tính t ơng đồng (SATS) đ ợc dùng cho phát hiện xoay [31, 9], SIFT cho xoay và tỉ lệ [26], SUFT cho xoay, tỉ lệ, nhi u cộng và nhòe [4], SVM cho phát hiện vùng nhòe [36]. Bi n đổi FMT thì bền vững đối với xoay, tỉ lệ, nhi u và nhòe với chi phí tính toán thấp. 6. ê Độ chính x c: ỉ lệ số lần ph t hiện đúng tr n tổng số ảnh giả đầu vào hi phí tính to n: l ợng tính to n cần dùng để cho ra t quả, cần l u ý hi ứng dụng vào hệ thống th i gian thực Độ nhạy với c c phép bi n đổi: chỉ ra mức độ t quả bị ảnh h ởng bởi c c điều iện thử nghiệm h c nhau. Không nhạy với thay đổi của nhi u. ức độ tự động: giảm thiểu can thiệp của con ng i trong việc di n dịch và đ a ra t luận gi m định. Độ chính x c n n là ti u chí hàng đầu, vì đây là t quả cuối cùng ảnh h ởng tới quy t định gi m định, nhất là hi liên quan tới luật pháp, còn các tiêu chí h c có thể 11 đ nh đổi qua lại Độ nhạy có thể đ ợc giới hạn ở một số hía cạnh và ứng dụng để ph ơng ph p đề ra có thể đ p ứng tốt một số mục ti u nhất định. iệu năng có thể đ ợc biểu di n d ới dạng thống độ chính x c, độ nhạy và độ ri ng biệt Độ nhạy (Sensitivity) là thông số đo l ng độ chính x c phân loại đúng đối với ảnh giả (tức, ảnh giả đ ợc x p loại là giả), Độ ri ng biệt ( pecificity) đo l ng độ chính x c phân loại đúng đối với ảnh thực (tức, ảnh thực đ ợc x p loại là thực) và Độ chính x c (Accuracy) là tỉ lệ phần trăm giữa số ảnh phân loại đúng tr n tổng số ảnh xem xét (tức, ảnh giả đ ợc x p loại là giả và ảnh thực đ ợc x p loại là thực), tính nh (1): 100 TP TN Accuracy TP TN FN FP (1) Với: TP (True Positive): số ảnh giả đ ợc x p đúng là ảnh giả FN (False Negative): số ảnh giả đ ợc x p sai thành ảnh thực FP (False Positive): số ảnh thực đ ợc x p sai thành ảnh giả TN (True Negative): số ảnh thực đ ợc x p đúng là ảnh thực 7. l rong hi ỹ thuật watermar và signature đ ợc dùng nh là công cụ chủ động để giúp chủ nhân của c c bức ảnh số bảo vệ quyền t c giả của mình, thì phần còn lại của câu chuyện gi m định ảnh là ph t hiện mù tr n những bức ảnh hông rõ nguồn gốc ớng ti p cận dựa vào độ r i sáng và không gian màu là ph ơng ph p ph t hiện hứa hẹn ph t triển nhất vì nó hông phụ thuộc vào c c phép bi n đổi p dụng tr n vùng ảnh giả uy nhi n, h ớng ti p cận này cũng phải đối mặt với hó hăn về định vị và hoanh vùng ảnh giả r i lại, h ớng ti p cận dựa vào m y ảnh mang tính ém hả thi nhất vì nó y u cầu đ ợc bi t một số thông tin có tr ớc từ ảnh hả nghi, điều mà vốn hông thể đạt đ ợc trong ứng dụng thực t hép bi n đổi nh D hay F ti p tục là ỹ thuật hiệu quả để biểu di n lại ảnh với ích th ớc nhỏ hơn (giảm thông tin d thừa) để giảm hối l ợng tính to n Ngoài ra, hai tập dữ liệu ảnh th ng dùng phổ bi n trong c c công trình gần đây đ ợc đ nh gi là đủ tốt để thử nghiệm và so s nh giữa c c ph ơng ph p, đó là o oFoD (từ phòng thí nghiệm Video ommunications, Đại h c Zagreb, roatia) và A IA (từ Viện ự động Nhận dạng ẫu, c việc hoa h c Quốc gia, rung Quốc) ổng quan, nhiều ph ơng ph p đã đ ợc đề xuất để xử lý c c th ch thức trong ph t hiện ảnh giả, tuy nhi n chúng vẫn còn nhiều giới hạn về tính ứng dụng thực t ột phần là vì có đặt tr ớc giới hạn trong giả thuy t ban đầu, một phần là vì thi u một mô hình chung và chuẩn hóa để hội tụ c c nh nh nghi n cứu còn đang ri ng lẻ Việc đ nh gi tính bền vững đối với c c loại phép bi n đổi đ ợc dùng tr n vùng ảnh giả vẫn dựa tr n thực nghiệm iểm chứng là chủ y u, n n nhu cầu về một mô hình to n h c hỗ trợ cho việc phân tích t quả cũng nh là dự đo n và ớc l ợng tr ớc tính bền vững của giải ph p (hay cụ thể là loại đặc tr ng) đ ợc đề xuất là cần thi t 8. l n Bài hảo s t này đã tóm tắt phần lớn các h ớng nghi n cứu về lĩnh vực gi m định ảnh giả trong 15 năm gần đây, tập trung chủ y u vào h ớng ph t hiện mù rong h ớng ti p cận chủ động, có hai ỹ thuật chính đ ợc dùng là watermar ing và signature; còn h ớng ti p cận bị động, có năm nhóm chính là dựa vào pixel, định 12 dạng, m y ảnh và độ r i s ng ai ỹ thuật dựa vào hối pixel và eypoint cũng là một c ch phân loại h c Bài vi t cũng đã chỉ ra u nh ợc điểm của mỗi nhóm phân loại Nhiều ỹ thuật đ ợc đ a ra cho thấy sự cải thiện lớn về độ chính x c l n tới 99%; tuy nhi n, th ng luôn có sự đ nh đổi giữa độ chính xác, mức phức tạp và độ bền vững trong giải thuật Ngoài ra, việc đối phó với c c phép bi n đổi tuy n tính cũng là một trong c c th ch thức lớn nhất trong việc xây dựng giải ph p mang tính bền vững, do sự đa dạng và tính t hợp của c c phép bi n đổi đ ợc dùng hi tạo ảnh giả. Lời c ông trình này đ ợc tài trợ bởi quỹ Đại h c Quốc gia Thành phố Hồ Chí Minh với mã sốB2015-20-02. TÀI LIỆU THAM KHẢO 1. Bashar, M., Noda, K., Ohnishi, N., và Mori, K. (2010). Exploring duplicated regions in natural images. IEEE Transactions on Image Processing, vol. PP, no. 99, pp. 1-1. 2. Belkasoft, Belkasoft database. [Online]. Available: https://belkasoft.com/forgery-detection 3. Bender, W., Gruhl, D., Morimoto, N., và Lu, A. (1996). Techniques for data hiding. IBM systems journal, 35(3.4), pp. 313-336. 4. Bo, X., Junwen, W., Guangjie, L., và Yuewei, D. (2010). Image copymove forgery detection based on surf. In Multimedia Information Networking and Security (MINES), 2010 International Conference on, pages 889-892. IEEE. 5. Carvalho, T. J. d., Riess, C., Angelopoulou, E., Pedrini, H., và de Rezende Rocha, A. (2013). Exposing digital image forgeries by illumination color classification. Information Forensics and Security, IEEE Transactions on, 8(7):1182-1194. 6. Carvalho, Tiago, Hany Farid, và Eric Kee. (2015). Exposing photo manipulation from user-guided 3D lighting analysis. SPIE/IS&T Electronic Imaging. International Society for Optics and Photonics. 7. CASIA. Tampering detection dataset. [Online]. Available: 8. Chang, C. C., Hsiao, J. Y., và Chan, C. S. (2003). Finding optimal least-significant-bit substitution in image hiding by dynamic programming strategy. Pattern Recognition, 36(7), 1583-1595. 9. Christlein, V., Riess, C., và Angelopoulou, E. (2010). On rotation invariance in copy-move forgery detection. In Information Forensics and Security (WIFS), 2010 IEEE International Workshop on, pages 1-6. IEEE. 10. Cox, I. J., Kilian, J., Leighton, F. T., và Shamoon, T. (1997). Secure spread spectrum watermarking for multimedia. IEEE Transactions on Image Processing, 6(12):1673-1687. 11. Fridrich, A. J., Soukal, B. D., và u š, A. J. (2003). Detection of copy-move forgery in digital images. In in Proceedings of Digital Forensic Research Workshop. Citeseer. 12. Fridrich, J. (2009). Digital image forensics. Signal Processing Magazine, IEEE, 26(2):26-37. 13. Gopi, E., Lakshmanan, N., Gokul, T., Kumara Ganesh, S., và Shah, P. R. (2006). Digital image forgery detection using artificial neural network and auto regressive coefficients. In Electrical and Computer Engineering, 2006. E E’06 anadian onference on, pages 194-197. IEEE. 14. Hu, H. T., Chang, J. R., và Hsu, L. Y. (2016). Robust blind image watermarking by modulating the mean of partly sign-altered DCT coefficients guided by human visual perception. AEU-International Journal of Electronics and Communications. 15. Isaac, M. M., và Wilscy, M. (2015). Image Forgery Detection Based on Gabor Wavelets and Local Phase Quantization. Procedia Computer Science, 58, 76-83. 16. Jiansheng, M., Sukang, L., và Xiaomei, T. (2009). A digital watermarking algorithm based on DCT and DWT. In Proceedings of the 2009 International Symposium on Web Information Systems and Applications (WI A’09) Nanchang, R hina, pages 104-107. Citeseer. 17. Johnson, Micah K., và Hany Farid. (2005) Exposing digital forgeries by detecting inconsistencies in lighting. Proceedings of the 7th workshop on Multimedia and security. ACM. 18. Kaur, M., và Walia, S. (2016). Forgery Detection Using Noise Estimation and HOG Feature Extraction. International Journal of 13 Multimedia and Ubiquitous Engineering, 11(4), 37-48. 19. Lin, H.-J., Wang, C.-W., Kao, Y.-T., và Chen, S. (2009a). An efficient method for copy-move forgery detection. In WSEAS International Conference. Proceedings. Mathematics and Computers in Science and Engineering, number 8. World Scientific and Engineering Academy and Society. 20. Lin, H.-J., Wang, C.-W., Kao, Y.-T., et al. (2009b). Fast copy-move forgery detection. WSEAS Transactions on Signal Processing, 5(5): 188-197. 21. Lin, C. S., và Tsay, J. J. (2015). Passive forgery detection for JPEG compressed image based on block size estimation and consistency analysis. Applied Mathematics and Information Sciences, 9(2), 1015. 22. Luxion. Keyshot program. [Online]. Available: https://www.keyshot.com 23. Mushtaq, S. và Mir, A. H. (2014). Digital image forgeries and passive image authentication techniques: A survey. International Journal of Advanced Science and Technology, 73:15–32. 24. Myrna, A., Venkateshmurthy, M., và Patil, C. (2007). Detection of region duplication forgery in digital images using wavelets and log-polar mapping. In Conference on Computational Intelligence and Multimedia Applications, 2007. International Conference on, volume 3, pages 371-377. IEEE. 25. Nillius, Peter, và Jan-Olof Eklundh. (2001). Automatic estimation of the projected light source direction. Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on. Vol. 1. IEEE. 26. Pan, X. và Lyu, S. (2010). Detecting image region duplication using sift features. In ICASSP, pages 1706–1709. 27. Pathak, S., Tiwari, S., và Agrawal, S. (2016). Digital image watermarking in Wavelet domain using chaotic. Futuristic Trends in Engineering, Science, Humanities, and Technology FTESHT-16, 108. 28. Popescu, A. và Farid, H. (2004). Exposing digital forgeries by detecting duplicated image region [technical report]. 2004-515. Hanover, Department of Computer Science, Dartmouth College. USA. 29. Qazi, T., Hayat, K., Khan, S. U., Madani, S. A., Khan, I. A., Ko lodziej, J., Li, H., Lin, W., Yow, K., và Xu, C.-Z. (2013). Survey on blind image forgery detection. Image Processing, IET, 7(7):660-670. 30. Rajkumar, R., Chanu, T. A., và Singh, N. N. (2016). Copy move forgery detection approaches: A survey. ADBU Journal of Engineering Technology, 31. Ryu, S.-J., Lee, M.-J., và Lee, H.-K. (2010). Detection of copy-rotatemove forgery using zernike moments. In Information Hiding, pages 51–65. Springer. 32. Su, Q., Wang, G., Lv, G., Zhang, X., Deng, G., và Chen, B. (2016). A novel blind color image watermarking based on Contourlet transform and Hessenberg decomposition. Multimedia Tools and Applications, 1-21. 33. Thajeel, S. A. N., và Sulong, G. (2015). A novel approach for detection of copy move forgery using completed robust local binary pattern. Journal of Information Hiding and Multimedia Signal Processing, 6(2), 351-364. 34. Tiwari, N., Ramaiya, M. K., và Sharma, M. (2013). Digital watermarking using DWT and DES. In Advance Computing Conference (IACC), 2013 IEEE 3rd International, pages 1100–1102. 35. Unknown. Retouching image. [Online]. Available: www.retouchingphotos.wikispaces.com 36. Wang, B., Kong, X., Bertino, E., và Fu, H. (2009). Exposing copypasteblur forgeries based on color coherence. Chinese Journal of Electronics, 18(3):487-490. 37. Wang, R. Z., Lin, C. F., và Lin, J. C. (2001). Image hiding by optimal LSB substitution and genetic algorithm. Pattern recognition, 34(3), 671-683. 38. Yang, R., Bai, Z., Yin, L., và Gao, H. (2015). Detecting of copy-move forgery in digital images using fractional Fourier transform. In Seventh International Conference on Digital Image Processing (ICDIP15) (pp. 96310B- 96310B). International Society for Optics and Photonics. 39. Yu, Y. H., Chang, C. C., và Hu, Y. C. (2005). Hiding secret data in images via predictive coding. Pattern Recognition, 38(5), 691-705. Ngày nhận bài: 30/8/2016 Biên tập xong: 15/9/2016 Duyệt đăng: 20/9/2016
File đính kèm:
- nhung_phuong_phap_tiep_can_ve_ky_thuat_giam_dinh_anh_so.pdf