Một kỹ thuật phân lớp ảnh viễn thám sử dụng tiếp cận lai
Tóm tắt: Phân loại ảnh viễn thám là vấn đề được
các nhà nghiên cứu viễn thám quan tâm. Có 2
hướng tiếp cận chủ yếu là dựa trên điểm ảnh và
hướng đối tượng cho vấn đề này. Ảnh viễn thám có
thể có nhiều kênh và độ phân giải rất cao. Hướng
tiếp cận dựa trên điểm ảnh thường cho độ chính
xác cao nhưng gặp vấn đề khi phân loại ảnh có
kích thước lớn như ảnh viễn thám. Trong khi đó,
tiếp cận dựa trên đối tượng khắc phục được vấn
đề kích thước ảnh nhưng thường có độ chính xác
thấp hơn so với hướng tiếp cận điểm ảnh. Bài báo
này đề xuất một tiếp cận lai với sự kết hợp cả hai
hướng tiếp cận để đưa ra một thuật toán phân loại
ảnh viễn thám hiệu quả hơn. Thuật toán được thử
nghiệm trên tập dữ liệu là các ảnh viễn thám thuộc
tỉnh Hoà Bình.
Từ khóa: Viễn thám, phân loại ảnh, tiếp cận hướng
điểm ảnh, tiếp cận hướng đối tượng, tiếp cận lai.1
Tóm tắt nội dung tài liệu: Một kỹ thuật phân lớp ảnh viễn thám sử dụng tiếp cận lai
MỘT KỸ THUẬT PHÂN LỚP ẢNH VIỄN THÁM SỬ DỤNG TIẾP CẬN LAI Tạp chí KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG50 Số 2 (CS.01) 2016 MỘT kỸ THUẬT PHÂN LỚP ẢNH VIỄN THÁM SỬ DỤNG TIẾP CẬN LAI Nguyễn Tu Trung1, Ngô Hoàng Huy1, Đặng Văn Đức1, Vũ Văn Thỏa2, Lại Anh Khôi3 1 Viện Công nghệ thông tin, Viện Khoa học và Công nghệ Việt Nam 2 Học viện Công nghệ Bưu chính Viễn thông 3 Viện Công nghệ Vũ trụ, Viện Khoa học và Công nghệ Việt Nam Tóm tắt: Phân loại ảnh viễn thám là vấn đề được các nhà nghiên cứu viễn thám quan tâm. Có 2 hướng tiếp cận chủ yếu là dựa trên điểm ảnh và hướng đối tượng cho vấn đề này. Ảnh viễn thám có thể có nhiều kênh và độ phân giải rất cao. Hướng tiếp cận dựa trên điểm ảnh thường cho độ chính xác cao nhưng gặp vấn đề khi phân loại ảnh có kích thước lớn như ảnh viễn thám. Trong khi đó, tiếp cận dựa trên đối tượng khắc phục được vấn đề kích thước ảnh nhưng thường có độ chính xác thấp hơn so với hướng tiếp cận điểm ảnh. Bài báo này đề xuất một tiếp cận lai với sự kết hợp cả hai hướng tiếp cận để đưa ra một thuật toán phân loại ảnh viễn thám hiệu quả hơn. Thuật toán được thử nghiệm trên tập dữ liệu là các ảnh viễn thám thuộc tỉnh Hoà Bình. Từ khóa: Viễn thám, phân loại ảnh, tiếp cận hướng điểm ảnh, tiếp cận hướng đối tượng, tiếp cận lai.1 I. MỞ ĐẦU Độ phân giải của ảnh đa phổ ngày càng tăng. Gần đây, các ảnh viễn thám có độ phân giải nhiều mét. Hiện tại, khi mà các vệ tinh mới đã đạt được 60 centimet của độ phân giải thì mức độ chi tiết tăng lên 10 lần. Với các ảnh như vậy, chúng ta có thể cho rằng mỗi điểm ảnh là một phần của một đối tượng đơn giản. Do đó, tính hỗn tạp của ảnh tăng lên rõ rệt. Các ảnh vệ tinh được sử dụng chủ yếu trong các hệ thông tin địa lý (GIS). Việc phân loại chúng rất Tác giả liên hệ: Nguyễn Tu Trung Email: trungnt.sremis@gmail.com Đến tòa soạn: 23/7/2016, chỉnh sửa: 30/8/2016, chấp nhận đăng: 03/9/2016. có ích cho khoa nghiên cứu bản đồ. Với các ảnh đa phổ có độ phân giải thấp, cường độ của các điểm ảnh đủ để phân loại riêng rẽ từng điểm của chúng. Ngược lại, việc phân loại ảnh có độ phân giải cao khó hơn rất nhiều. Việc tăng độ phức tạp của cảnh tạo ra các mức độ chi tiết khác nhau. Ví dụ một cây trong một cánh đồng hay các bóng râm của các đối tượng có thể nhìn thấy và thông tin ngữ cảnh của các điểm ảnh trở nên cần thiết cho một phân loại tốt. Các phần mềm phân loại GIS và phần mềm dùng trong lĩnh vực y học đang tồn tại nói chung đều sử dụng các phương pháp giống nhau cho các ảnh có độ phân giải thấp và cao. Nếu như các kết quả vừa ý có thể đạt được với các ảnh độ phân giải thấp, thì hiệu quả của các phần mềm này với các ảnh độ phân giải cao vẫn cần phải xem xét và nghiên cứu thêm. Chính vì vậy, để đảm bảo một sự chính xác tốt, việc phân loại bằng tay đôi khi được ưu tiên hơn các phương pháp tự động. Trong phân loại ảnh viễn thám, có 2 hướng tiếp cận chủ yếu dựa trên điểm ảnh và hướng đối tượng cho vấn đề này. Hướng tiếp cận dựa trên điểm ảnh [9] thường cho độ chính xác cao nhưng gặp vấn đề khi phân loại ảnh có kích thước lớn như ảnh viễn thám. Hướng tiếp cận dựa trên đối tượng bao gồm hai giai đoạn chính [2]. Một là, xác định đối tượng là các vùng (cụm) sử dụng các thuật toán phân loại không giám sát (phân vùng, phân cụm). Phân cụm là một quy trình dùng để trích chọn những nét chính của các đối tượng nền bởi việc định nghĩa các vùng tương ứng. Có nhiều phương pháp phân vùng khác nhau như: Các phương pháp hình thái, Các phương pháp họ K-means, Mô hình pha trộn Gaussian có giới hạn (FGMM), Tách và hợp, Các mô hình Markov,... Hiện nay, một số thuật toán bao Nguyễn Tu Trung, Ngô Hoàng Huy, Đặng Văn Đức, Vũ Văn Thỏa, Lại Anh Khôi Tạp chí KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Số 2 (CS.01) 2016 51 gồm thông tin ngữ cảnh trong quy trình để giảm bớt tính hỗn tạp của các phân đoạn [2]. Trong [4], Chen và cộng sự đã trình bày thuật toán phân cụm KMeans sử dụng thay thế tâm cụm. Trong [5], Balaji và cộng sự đã trình bày thuật toán phân cụm mới dựa trên việc chuyển đổi ảnh từ không gian màu RGB sang không gian L*a*b và phân cụm trên không gian này. Hai là, phân loại đối tượng sử dụng các thuật toán phân loại có giám sát. Trong [6], các tác giả đã sử dụng tiếp cận mạng Neural để phân lớp ảnh Landsat. Một trong những phương pháp phân loại được sử dụng phổ biến nhất trong ảnh viễn thám có thể kể đến là phương pháp phân loại hợp lý tối đa [1]. Đây là phương pháp phân loại dựa trên hướng tiếp cận điểm ảnh. Trong [7], Nedeljkovic đề xuất thuật toán phân lớp ảnh dựa trên logic mờ và thuật toán phân loại hợp lý tối đa. Hướng tiếp cận dựa trên đối tượng khắc phục được vấn đề kích thước ảnh nhưng thường có độ chính xác thấp hơn so với hướng điểm ảnh. Trong nghiên cứu này, chúng tôi đề xuất tiếp cận phân loại ảnh viễn thám mới mà thuật toán cài đặt từ tiếp cận này được cải tiến từ phương pháp phân loại hợp lý tối đa với sự kết hợp cả hai hướng tiếp cận trên. II. TIẾP CẬN HƯỚNG ĐIỂM ẢNH VÀ HƯỚNG ĐỐI TƯỢNG A. Tiếp cận hướng điểm ảnh Tiếp cận kinh điển của phân loại ảnh viễn thám dựa trên điểm ảnh [9]. Tiếp cận này chỉ thông tin phổ được sử dụng trong việc phân loại [8]. Tiếp cận này bao gồm phương pháp phân loại có giám sát và không giám sát truyền thống [8][9]. Phương pháp phân loại hợp lý tối đa (maximum likehood) thuộc tiếp cận này. Hình 1 minh hoạ quy trình phân loại ảnh hướng điểm ảnh. Hình 1. Quy trình phân loại ảnh đa phổ hướng điểm ảnh B. Tiếp cận hướng đối tượng Trong tiếp cận hướng đối tượng, đơn vị xử lý không còn là các điểm ảnh đơn giản mà là các đối tượng ảnh [8]. Đầu tiên, ảnh được phân đoạn thành các nhóm điểm ảnh có nghĩa. Thứ hai, một tập các luật phân đoạn dựa trên tri thức để mô tả mỗi lớp được định nghĩa. Luật bao gồm thông tin phổ, không gian, ngữ cảnh và kết cấu [8]. Và sau đó, bộ phân loại sẽ được chọn để gán mỗi đoạn về lớp phù hợp theo luật [10]. Hình 2 minh hoạ quy trình phân loại dựa trên tiếp cận hướng đối tượng. Ảnh gốc Phân vùng Danh sách vùng Trích chọn đặc trưng Dữ liệu đặc trưng đối tượng Phân loại đối tượng Kết quả Hình 2. Quy trình phân loại ảnh đa phổ hướng đối tượng III. PHÂN LOẠI HỢP LÝ TỐI ĐA Trong [1], phương pháp phân loại hợp lý tối đa được trình bày một cách chi tiết. A. Phân loại Bayes Ký hiệu các lớp phổ cho một ảnh qua việc biểu diễn như sau: , 1, ,i i Mw = . Trong đó, M là tổng số lớp. Trong việc cố gắng xác định lớp hoặc loại mà vector điểm ảnh x thuộc lớp đó là xác xuất có điều kiện ( )/ , 1, ,ip x i Mw = . Vector độ đo x là một cột giá trị độ sáng cho điểm ảnh. Nó mô tả điểm ảnh như một điểm trong không gian đa phổ với hệ tọa độ được bởi độ sáng. Xác suất ( )/ip xw cho sự hợp lý mà lớp chính xác là iw cho một điểm ảnh tại vị trí x. Phân loại được thực hiện theo ( ) ( ), / / i i jx n p x p x j iw w w∈ > ∀ ¹Õu (1) Nghĩa là, điểm ảnh tại x thuộc lớp iw nếu ( )/ip xw là lớn nhất. Luật quyết định trực giác này là một trường hợp đặc biệt của một luật tổng quát hơn trong đó các quyết định có thể được chịu ảnh hưởng theo mức độ khác nhau của ý nghĩa được gắn đến sự phân loại không chính xác khác. MỘT KỸ THUẬT PHÂN LỚP ẢNH VIỄN THÁM SỬ DỤNG TIẾP CẬN LAI Tạp chí KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG52 Số 2 (CS.01) 2016 B. Luật quyết định hợp lý tối đa Mặc dù rất đơn giản, ( )/ip xw không được biết đến. Tuy nhiên, nếu giả sử rằng dữ liệu huấn luyện đầy đủ sẵn sàng cho mỗi loại che phủ đất. Điều này có thể được dùng để ước lượng một phân bố xác suất cho một loại che phủ mà mô tả cơ hội tìm một điểm ảnh từ lớp iw tại vị trí x. Sau đó, việc hình thức hóa hàm phân bố này sẽ được tạo cụ thể hơn. Tuy nhiên, hiện tại, hàm này được giữ lại trong dạng chung và được biểu diễn bởi ký hiệu ( )/ip xw . Sẽ có nhiều ( )/ ip x w như có các lớp che phủ đất. Nói cách khác, với một điểm ảnh tại vị trí x trong không gian đa phổ một tập các khả năng có thể được tính mà đưa ra sự hợp lý liên quan mà điểm ảnh thuộc về mỗi lớp sẵn có. ( )/ip xw mong muốn trong phần 1 và ( )/ ip x w sẵn có – được ước lượng từ dữ liệu huấn luyện – liên quan bởi định lý Bayes (Freund, 1992): ( ) ( )/ / ( ) / ( )i i ip x p x p p xw w w= (2) Trong đó, ( )ip w là xác suất mà lớp xảy ra trong ảnh. Nếu, chẳng hạn, 15% điểm ảnh của ảnh thuộc về lớp iw thì ( ) 0.15ip w = ; p(x) trong (2) là xác suất để tìm được điểm ảnh trong bất kỳ lớp nào tại vị trí x. Nó được quan tâm vì: ( ) ( ) 1 / ( ) M i i i p x p x pw w = = ∑ (3) mặc dù chính ( )p x không quan trọng trong những điều sau đây. ( )ip w được gọi là xác suất ưu tiên, khi chúng là xác suất với thành viên lớp của một điểm ảnh có thể được dự đoán trước khi phân loại. Bằng việc so sánh ( )/ip xw là các khả năng sau đó. Sử dụng (2) có thể thấy rằng luật phân loại của phần 1 là: ( ) ( ), / ( ) / ( ) i i i j jx p x p p x p j iw w w w w∈ > ∀ ¹nÕu (4) Trong đó, ( )p x đã được xóa như một thừa số chung. Luật (4) dễ chấp nhận hơn so với luật (1) khi ( )/ ip x w được biết từ dữ liệu huấn luyện và nó có thể được hiểu rằng ( )ip w cũng đã biết hoặc có thể ước lượng từ tri thức phân tích ảnh. Kết quả phù hợp về mặt toán học nếu trong (4) định nghĩa: ( ) ( ){ } ( )ln / ( ) ln / ln ( )i i i i ig x p x p p x pw w w w= = + (5) được sử dụng, trong đó ln là logarit tự nhiên và (4) được trình bày lại như sau: ( ) ( ), i i jx g x g x j iw∈ > ∀ ¹nÕu (6) Nghĩa là, với thay đổi như trên, luật quyết định được sử dụng trong phân loại hợp lý tối đa; ( )ig x tham chiếu đến hàm phân biệt (discriminant). C. Mô hình lớp chuẩn đa biến Ở giai đoạn này, giả sử rằng phân bố xác suất của các lớp thuộc dạng mô hình chuẩn đa biến. Đây là một giả định, hơn là một thuộc tính có thể chứng minh của các lớp phổ tự nhiên hoặc thông tin. Tuy nhiên, nó dẫn đến sự đơn giản hóa về mặt toán học như sau đây. Hơn nữa nó là một phân bố cho các thuộc tính của dạng đa biến đã biết. Trong (4) vì thế, bây giờ được giả sử cho N kênh rằng ( ) ( ) ( ) 1 1/2/2 1/ (2 ) 2 tN i i i i i p x exp x m x mw π − −− = Σ − − − ∑ (7) ( ) ( ) ( ) ( ) 11 1 ln / – ln 2 2 2 2 t i i i i i N p x x m x m ln w π − = − Σ − − −∑ (7.1) Trong đó, im và iΣ là vector trung bình và ma trận hiệp phương sai của dữ liệu trong lớp iw . Ta có – / 2 (2 )N ln π là chung cho tất cả ( )ig x và không giúp cho sự phân biệt. Do đó, thừa số này được bỏ qua và dạng cuối của hàm phân biệt cho phân loại hợp lý tối đa, dựa trên giả định của thống kê chuẩn, là (thay 7.1 vào 5): ( 1)1 1( ) ( ) | | ( ) ( ) 2 2 t i i i i i ig x lnp ln x m x mw −= − ∑ − − ∑ − (8) Nguyễn Tu Trung, Ngô Hoàng Huy, Đặng Văn Đức, Vũ Văn Thỏa, Lại Anh Khôi Tạp chí KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Số 2 (CS.01) 2016 53 Thông thường, người phân tích không có thông tin hữu ích về ( )ip w , trong trường hợp một tình huống của các khả năng ưu tiên cân bằng được giả định; như một hệ quả ( )ilnp w có thể được xóa bỏ từ (7) khi nó giống nhau với mọi i. Trong trường hợp này thừa số ½ cũng có thể được loại bỏ, như hàm phân biệt: 1( ) | | ( ) ( )ti i i i ig x ln x m x m −= − ∑ − − ∑ − (9) Việc cài đặt luật quyết định hợp lý tối đa liên quan đến việc sử dụng hoặc (8) hoặc (9) trong (6). Tuy nhiên có một suy xét xa hơn liên quan đến liệu rằng bất kỳ nhãn hay lớp nào sẵn sàng cũng hợp lý. IV. ĐỀ XUẤT PHƯƠNG PHÁP PHÂN LOẠI DỰA TRÊN TIẾP CẬN LAI Trong nghiên cứu này, chúng tôi đề xuất một tiếp cận phân loại ảnh với sự kết hợp cả hai tiếp cận trên mà chúng tôi tạm gọi là tiếp cận lai. Đầu tiên, ảnh gốc được tiến hành phân vùng. Thay vì trích chọn đặc trưng đối tượng như trong tiếp cận hướng đối tượng, các vùng sẽ được đưa vào bộ phân loại lai để cho quyết định phân lớp cuối cùng. Hình 3 mô tả quy trình phân loại theo tiếp cận lai. Hình 3. Quy trình phân loại ảnh đa phổ theo tiếp cận lai. A. Phân vùng ảnh (Unsupervised Segmentation) Phân đoạn là một quy trình dùng để trích chọn những nét chính của các đối tượng nền bởi việc định nghĩa các vùng tương ứng. Nhiệm vụ của chức năng phân vùng ảnh là từ ảnh đa phổ ban đầu, tiến hành xử lý và phân chia thành các vùng, các cụm khác nhau. Hiện nay, có nhiều phương pháp phân vùng khác nhau như: Các phương pháp hình thái, Các phương pháp họ K-means, Mô hình pha trộn Gaussian có giới hạn (FGMM), Tách và hợp, Các mô hình Markov,... Hầu hết các phương pháp chỉ sử dụng cường độ của mỗi điểm ảnh để định nghĩa các vùng, nhưng đưa ra các phân đoạn rất hỗn tạp, cụ thể với các ảnh đa phổ có độ phân giải cao. Hiện nay một số thuật toán bao gồm thông tin ngữ cảnh trong quy trình để giảm bớt tính hỗn tạp của các phân đoạn. Trong đó một số thông tin ngữ cảnh của các phân đoạn này được trích chọn từ ảnh cũng được sử dụng. Bảng I. Thuật toán KMeansCMN Đầu vào: n đối tượng và số cụm k Đầu ra: Các cụm Ci (i =1... k) sao cho hàm mục tiêu E sau đây đạt cực tiểu: 2 ( 1) ( ) ( , )i k i x C iE d x m= ∈∑= ∑ Bước 1: Khởi tạo Chọn k đối tượng Cj (j = 1... k) là tâm ban đầu của k cụm dữ liệu đầu vào (lựa chọn ngẫu nhiên hoặc theo kinh nghiệm). Bước 2: Gán tâm cụm theo khoảng cách Với mỗi đối tượng xi (1 ≤ i ≤ n), tính khoảng cách của nó tới mỗi tâm Cj với j = 1...k. Đối tượng thuộc về cụm CS mà khoảng cách từ tâm CS tương ứng đến đối tượng đó là nhỏ nhất. ( ), min ( , ),1S jd x C d x C j k= ≤ ≤ (10) Bước 3: Cập nhật tâm cụm Đối với mỗi j = 1...k, cập nhật lại tâm cụm Cj bằng cách xác định trung bình cộng của các vector đối tượng dữ liệu đã được gán về cụm. Nếu số lượng điểm ảnh trong cụm nhỏ hơn hằng số rất lớn Max thì tâm vẫn tính theo công thức như sau: ( ) ( ( )) x cluster j j x C count cluster j ∈= ∑ (11) Nếu số lượng điểm ảnh trong cụm lớn hơn hằng số rất lớn Max thì tâm tính theo công thức như sau: j jC CMN(Cluster )= (11a) Bước 4: Lặp và kiểm tra điều kiện dừng Lặp lại các bước 2 và 3 cho đến khi các tâm cụm không thay đổi giữa hai lần lặp liên tiếp. Một vấn đề chung với các hệ thống xử lý tiếng nói là các đặc trưng của các kênh có thể biến đổi từ một phiên sang phiên tiếp theo. Một phương pháp được sử dụng để cự tiểu hóa ảnh hưởng của những khác biệt này trên hiệu năng nhận dạng là phép chuẩn MỘT KỸ THUẬT PHÂN LỚP ẢNH VIỄN THÁM SỬ DỤNG TIẾP CẬN LAI Tạp chí KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG54 Số 2 (CS.01) 2016 hóa trung bình phổ (Cepstral Mean Normalisation - CMN) [12]. Phương pháp này được áp dụng rộng rãi và hiệu quả trong xử lý tín hiệu số và nhận dạng tiếng nói. Tuy nhiên, khi áp dụng trong xử lý tín hiệu số thời gian thực, các tham số và tính đúng đắn của CMN được chọn và kiểm chứng thông qua thực nghiệm trên tín hiệu thực cụ thể mà thiếu các phép chứng minh hình thức chặt chẽ bằng toán học. Bài báo này chỉ ra một ứng dụng của phép chuẩn hóa CMN trong phân cụm ảnh viễn thám. Trong nghiên cứu này, chúng tôi đã thử nghiệm cài đặt thuật toán KMeans [11] và cải tiến thành KMeansCMN. Thuật toán KMeansCMN được trình bày như bảng I: Thủ tục tính tâm cụm CMN(Cluster j ) tại vòng lặp thứ n như sau: Bước 1: Khởi tạo tâm theo công thức 1n nj jC Cβ −= Bước 2: Với mỗi j x Cluster∈ tính theo công thức n n-1j jC = αC + βx Trong nghiên cứu này, chúng tôi chọn Max = 50000 và a = 0.95. B. Phân loại lai Hàm phân biệt ( )ig x như được trình bày trong mục III.C của phương pháp phân loại hợp lý tối đa chỉ áp dụng cho từng điểm ảnh. Trong phần này, chúng tôi đề xuất một cải tiến cho hàm phân biệt này để áp dụng cho việc phân lớp các cụm-đối tượng đã thu được từ giai đoạn phân loại không giám sát trong mục IV.A. Sau khi phân cụm ảnh gốc I ta được tập O cụm-đối tượng như sau: { }iO o : 0 i K= ≤ ≤ (12) Trong đó, o i Ço j = f; i∀ ¹ j, i, j = 1, 2,.., K; o1È o 2 È...È o K = I. Chúng tôi xây dựng hàm phân biệt cho mỗi cụm như sau: ( ) ( ) / ( )i i x o f o g x count o ∈ = ∑ (13) Hoặc ( ) ( )maxi ix of o g x∈= (13.1) Từ (6) chúng tôi đề xuất luật quyết định lớp cho mỗi cụm như sau: ( ) ( ), i i jo f o f o j iw∈ > ∀ ¹nÕu (14) V. THỬ NGHIỆM Tập dữ liệu phục vụ cho thử nghiệm gồm 2 loại. Một là, loại ảnh LANDSAT ETM+ chụp khu vực Hòa Bình, bao gồm các ảnh ranh giới từng huyện khu vưc tỉnh Hòa Bình.Hai là ảnh SPOT, loại ảnh có độ phân giải cao, gồm 4 kênh: Lục, Đỏ, Cận hồng ngoại, Hồng ngoại, chụp khu vực Hòa Bình và Sơn La với 21 ảnh chụp năm 2003 và 14 ảnh chụp năm 2008. Do khuôn khổ bài báo có hạn, nhóm tác giả trình việc thử nghiệm với hai mẫu ảnh đầu vào khác nhau. Để đánh giá chất lượng phân cụm, trong [13], các tác giả đã sử dụng chỉ số F(I) [14], tuân theo các tiêu chí về sự đồng nhất cụm [13] [15], để so sánh kết quả phân cụm của các thuật toán. F(I) càng nhỏ thì độ đồng nhất càng cao. Chỉ số này được tính như sau: ( ) 1 1 1000( ) R i ii e F I R N M A= = × ∑ A. Thử nghiệm thuật toán phân cụm 1) Thử nghiệm 1 Hình 4 là ảnh kết quả phân cụm của KMeans và KMeansCMN trong trường hợp 5 cụm với ảnh SPOT. Các ảnh từ 1 đến 5 là ảnh từng cụm. Ảnh thứ 6 là ảnh đã thay các điểm ảnh gốc bằng tâm các cụm. Bảng II. So sánh độ đồng nhất cụm (*1.0E + 3) Số cụm KMeans KMeansCMN 5 2.24 2.04 10 1.58 1.81 Nguyễn Tu Trung, Ngô Hoàng Huy, Đặng Văn Đức, Vũ Văn Thỏa, Lại Anh Khôi Tạp chí KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Số 2 (CS.01) 2016 55 Bảng II so sánh độ đồng nhất tâm cụm giữa KMeans và KMeansCMN. Bảng III thống kê số thời gian thực thi của KMeans và KMeansCMN với 5 cụm và 10 cụm. Chúng ta thấy độ đồng nhất của KMeansCMN là tốt hơn so với KMeans. Ngoài ra, thời gian phân cụm của KMeansCMN cũng nhỏ hơn KMeans. Bảng III. Thời gian phân cụm (MS) Số cụm KMeans KMeansCMN 5 2,616,938 2,413,791 10 11,275,333 8,618,345 Hình 4. Kết quả phân cụm bởi KMeans (a) và KMeansCMN (b) 2) Thử nghiệm 2 Hình 5 là ảnh kết quả phân cụm của KMeans và KMeansCMN trong trường hợp 5 cụm với ảnh LANSAT. Các ảnh từ 1 đến 5 là ảnh từng cụm. Ảnh thứ 6 là ảnh đã thay các điểm ảnh gốc bằng tâm các cụm. Hình 5. Kết quả phân cụm bởi KMeans (a) và KMeansCMN (b) Bảng IV. So sánh độ đồng nhất cụm (*1.0E-05) Số cụm KMeans KMeansCMN 5 1.66 1.5 8 1.61 1.53 Bảng IV so sánh độ đồng nhất tâm cụm giữa KMeans và KMeansCMN. Bảng V thống kê số bước lặp cũng như thời gian thực thi của KMeans MỘT KỸ THUẬT PHÂN LỚP ẢNH VIỄN THÁM SỬ DỤNG TIẾP CẬN LAI Tạp chí KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG56 Số 2 (CS.01) 2016 và KMeansCMN với 5 cụm và 8 cụm. Chúng ta thấy độ đồng nhất của KMeansCMN là tốt hơn so với KMeans. Ngoài ra, thời gian phân cụm của KMeansCMN cũng nhỏ hơn KMeans. Bảng V. Thời gian phân cụm (MS) Số cụm KMeans KMeansCMN 5 263,672 213,109 8 1,658,609 1,568,062 Nhận xét: Tốc độ hội tụ của KMeansCMN phân cụm tốt hơn và nhanh hơn so với KMeans. B. Thử nghiệm thuật toán phân lớp Kết quả thử nghiệm có sự so sánh giữa thuật toán phân loại theo phương pháp phân loại hợp lý tối đa (thuật toán gốc), được cài đặt trong phần mềm Grass và thuật toán dựa trên tiếp cậnlai (thuật toán cải tiến). Mẫu thứ nhất là ảnh SPOT với kích thước 2201 × 2101. Thực hiện việc phân loại ảnh đầu vào với 3 lớp: đất (màu nâu trong ảnh kết quả), nước (màu vàng trong ảnh kết quả), rừng (màu xanh lam trong ảnh kết quả). Kết quả phân loại được thể hiện trong hình 7. Từ kết quả trong hình 7, quan sát vùng được khoanh tròn trên ảnh, vùng rừng có xen lẫn đất với tính hỗn tạp rất cao. Tuy nhiên, thuật toán gốc không phản ánh rõ sự đan xen này mà quy về một lớp. Trong khi thuật toán cải tiến phân biệt rất rõ. Bảng VI. So sánh độ chính xác Lớp MLK Lai Đất 95% 98% Rừng 100% 100% Nước 98% 98% Bảng VII. So sánh độ chính xác Lớp MLK Lai Núi đá 85% 84% Rừng 90% 93% Nước 100% 100% Mẫu thứ hai là ảnh LANDSAT với kích thước 1596 × 1333. Thực hiện việc phân loại ảnh đầu vào với 3 lớp: Núi đá, nước, rừng. Kết quả được thể hiện trong hình 7. Ảnh đầu vào cũng có tính hỗn tạp cao và được thể hiện rõ hơn qua ảnh kết quả của thuật toán phân loại đề xuất. Hình 6. Ảnh đầu vào, kết quả phân loại thuật toán gốc và cải tiến Nguyễn Tu Trung, Ngô Hoàng Huy, Đặng Văn Đức, Vũ Văn Thỏa, Lại Anh Khôi Tạp chí KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Số 2 (CS.01) 2016 57 Hình 7. Ảnh đầu vào, kết quả phân loại thuật toán gốc và cải tiến VI. KẾT LUẬN Trong nghiên cứu này, chúng tôi đã đề xuất một tiếp cận phân loại lai với sự kết hợp cả hai tiếp cân hướng điểm ảnh và hướng đối tượng. Quy trình phân loại theo tiếp cận này gồm hai giai đoạn. Một là, phân vùng ảnh, trong thuật toán cải tiến theo tiếp cận này, chúng tôi sử dụng thuật toán KMeans. Hai là, phân loại lai, các vùng sau đó sẽ được phân lớp theo bộ phân loại lai sử dụng hàm quyết định phân lớp mới mà chúng tôi đề xuất để phân lớp các cụm-đối tượng. Hàm quyết định phân lớp này được cải tiến dựa trên hàm phân biệt của phương pháp phân loại hợp lý tối đa. Các kết quả thử nghiệm cho thấy kết quả phân loại của thuật toán dựa trên tiếp cận đề xuất cho độ chính xác cao hơn so với thuật toán của phương pháp hợp lý tối đa. Ngoài ra, trong giai đoạn phân vùng, chúng tôi đã đề xuất thuật toán KMeansCMN với mục tiêu áp dụng phương thức chuẩn hóa trung bình phổ để tính tâm cụm cho việc phân vùng ảnh viễn thám kích thước lớn. Các kết quả thử nghiệm cho thấy KMeansCMN phân cụm tốt với ảnh viễn thám kích thước lớn. Tốc độ phân cụm của KMeansCMN là tốt hơn so với KMeans thông thường. Hiện tại, thủ tục tính tâm theo CMN vẫn sử dụng nhiều tính toán với số thực nên tốc độ chậm. Trong nghiên cứu tiếp theo, nhóm tác giả dự kiến sử dụng phương pháp tính toán chấm tĩnh để tăng cường tốc độ thủ tục này nhằm tăng tốc độ phân cụm. TÀI LIỆU THAM KHẢO [1] John A. Richards, Xiuping Jia, Remote Sensing Digital Image Analysis, Springer-Verlag Berlin Heidelberg 2006. [2] Meritxell Bach Cuadra, Jean-Philippe Thiran, Satellite Image Segmentation and Classification, Fall 2004. [3] MacQueen, J.: Some methods for classification and analysis of multivariate observations. In Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability, Vol.1. University of California Press (1967) 281-297. [4] Chih-Tang Chang, Jimz. C. Lai, Muderjeng, A Fuzzy K-means Clustering Algorithm Using Cluster Center Displacement, Journal of Information Science and Engineering 27, 2011, pp. 995-1009. [5] Balaji T., Sumathi M., “Relational Features of Remote Sensing Image classification using Effective K-Means Clustering”, International Journal of Advancements in Research & Technology, Volume 2, Issue 8, August-2013, pp. 103-107. [6] Smriti Sehgal, “Remotely sensed Landsat Image Classification using Neural network approaches”, International Journal of Engineering Research and Applications, Vol. 2, Issue 5, 2012, pp.043-046. MỘT KỸ THUẬT PHÂN LỚP ẢNH VIỄN THÁM SỬ DỤNG TIẾP CẬN LAI Tạp chí KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG58 Số 2 (CS.01) 2016 [7] Nedeljkovic, “Image Classification based on fuzzy logic”, The International Archives of the Photogrammetry, Remote sensing and Spatial Information Sciences, Vol. 34, Part XXX, 2003. [8] Sun Xiaoxia, Zhang Jixian, Liu Zhengjun, “A comparison of object-oriented and pixel- based classification approachs using quickbird imagery”, Chinese Academy of Surveying and Mapping, Beijing, China. [9] H.R. Matinfar, F. Sarmadian, S.K. Alavi Panah, R.J. Heck, “Comparison of object-oriented and pixel-based classification on Lansadsat7, Etm+ Spectral Bands (Case Study: Arid Region of Iran)”, American-Eurasian J. Agric. &Environ, 2007. [10] Leukert k., “Transferability of knowledge- based classification rules”, ISPRS2004, Istanbul, 2004. [11] clustering. [12] cepstral-mean-normalization [13] Intan aidha yusoff, Nor ashidi mat isa, Two- Dimensional Clustering Algorithms for Image Segmentation, WSEAS Transactions on Computers, Issue 10, Volume 10, October 2011. [14] J. Liu, and Y. H. Yang, Multiresolution color image segmentation, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.16, no.7, pp.689-700, Jul 1994. [15] R. H. Haralick, and L. G. Shapiro, Image segmentations techniques, Computer Vision Graphics Image Processing 29, pp. 100-132, 1985. A TECHNIQUE OF CLASSIFYING REMOTE SENSING IMAGES BASED ON HYDRID APPROACH Abstract: Remote sensing image classification is interested by reseachers. Having two main approachs include the pixel based approach and the object oriented based approach. Remote sensing images can have multichannel and high resolution. The pixel based approach usually has high accuracy but having problem with large size images as remote sensing images. While the object oriented based approach the problem but usually having accuracy lower than the pixel based approach. This paper presents a hybrid technique which combines both of the approachs to propose a more effective classifying algorithm of the remote sensing image classification. The algorithm is experimented on data set which is remote sensing images of Hoa Binh province. Keyword: remote sensing, image classification, Object Oriented approach, Hybrid approach. Nguyễn Tu Trung, tốt nghiệp đại học Trường ĐH Sư phạm 2 Hà Nội năm 2007 và Thạc sỹ tại trường ĐH Công Nghệ, ĐHQGHN năm 2011, nghiên cứu sinh khóa 2013, Học viện Công nghệ Bưu chính Viễn thông. Lĩnh vực nghiên cứu: Xử lý ảnh, xử lý tiếng nói, hệ thống thông tin, hệ thống nhúng. Ngô Hoàng Huy, tốt nghiệp đại học trường ĐH Sư phạm Hà Nội năm 1990. Nơi công tác: Viện CNTT, Viện Hàn lâm KHCNVN. Hiện đang làm nghiên cứu sinh tại VCNTT, Viện Hàn lâm KHCNVN. Lĩnh vực nghiên cứu: Xử lý ảnh, xử lý tiếng nói, hệ thống thông tin, hệ thống nhúng. Đặng Văn Đức, nhận học vị Tiến sĩ năm 1996, Việt Nam. Nhận chức danh PGS năm 2002. Nơi công tác: Viện CNTT, Viện Hàn lâm KHCNVN. Lĩnh vực nghiên cứu: GIS và Viễn thám, Đa phương tiện, Công nghệ phần mềm. Vũ Văn Thoả, tốt nghiệp Đại học Sư phạm Vinh năm 1975, Tiến sĩ năm 1990 Viện Điều khiển tại Liên Xô cũ. Hiện công tác tại Khoa Quốc tế và Đào tạo Sau Đại học, Học viện Công nghệ Bưu chính Viễn thông. Lĩnh vực nghiên cứu: Lý thuyết thuật toán, tối ưu hóa, hệ thông tin địa lý, mạng viễn thông. Lại Anh Khôi, hiện công tác tại Viện Công nghệ Vũ Trụ, Viện Hàn lâm KHCNVN. Lĩnh vực nghiên cứu: Viễn thám.
File đính kèm:
- mot_ky_thuat_phan_lop_anh_vien_tham_su_dung_tiep_can_lai.pdf