Giáo trình Hướng dẫn học tập Xử lý âm thanh và hình ảnh - Học viện CN Bưu chính Viễn thông
Tài liệu hướng dẫn học tập môn "Xử lý âm thanh và hình ảnh" dành cho khối đào tạo từ xa
chuyên ngành điện tử viễn thông. Tài liệu này giới thiệu những kiến thức cơ bản về xử lý âm
thanh và hình ảnh. Đặc biệt, tác giả chú trọng tới vấn đề xử lý tín hiệu ứng dụng trong mạng viễn
thông: đó là các phương pháp nén tín hiệu, lưu trữ, các tiêu chuẩn nén tín hiệu âm thanh và hình
ảnh. Những kiến thức được trình bày trong tài liệu sẽ giúp học viên tiếp cận nhanh với các vấn đề
thực tiễn thường gặp trong mạng viễn thông.
Vì khối lượng kiến thức trong lĩnh vực xử lý âm thanh cũng như hình ảnh rất lớn, trong tài
liệu hướng dẫn chỉ có thể nêu lên một số vấn đề chính. Để tìm hiểu sâu và rộng hơn học viên phải
nghiên cứu thêm trong các sách tham khảo được tác giả đề cập tới trong phần cuối của tài liệu
này.
Đây là lần biên soạn đầu tiên, chắc chắn tài liệu còn nhiều sơ sót, rất mong các bạn đọc
trong quá trình học tập và các thày cô giảng dạy môn học này đóng góp các ý kiến xây dựng.
Tóm tắt nội dung tài liệu: Giáo trình Hướng dẫn học tập Xử lý âm thanh và hình ảnh - Học viện CN Bưu chính Viễn thông
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG SÁCH HƯỚNG DẪN HỌC TẬP XỬ LÝ ÂM THANH VÀ HÌNH ẢNH (DÙNG CHO SINH VIÊN HỆ ĐÀO TẠO ĐẠI HỌC TỪ XA) Biên soạn: TS Nguyễn Thanh Bình ThS Võ Nguyễn Quốc Bảo TP HỒ CHÍ MINH - 2007 LƯU HÀNH NỘI BỘ LỜI NÓI ĐẦU Tài liệu hướng dẫn học tập môn "Xử lý âm thanh và hình ảnh" dành cho khối đào tạo từ xa chuyên ngành điện tử viễn thông. Tài liệu này giới thiệu những kiến thức cơ bản về xử lý âm thanh và hình ảnh. Đặc biệt, tác giả chú trọng tới vấn đề xử lý tín hiệu ứng dụng trong mạng viễn thông: đó là các phương pháp nén tín hiệu, lưu trữ, các tiêu chuẩn nén tín hiệu âm thanh và hình ảnh. Những kiến thức được trình bày trong tài liệu sẽ giúp học viên tiếp cận nhanh với các vấn đề thực tiễn thường gặp trong mạng viễn thông. Vì khối lượng kiến thức trong lĩnh vực xử lý âm thanh cũng như hình ảnh rất lớn, trong tài liệu hướng dẫn chỉ có thể nêu lên một số vấn đề chính. Để tìm hiểu sâu và rộng hơn học viên phải nghiên cứu thêm trong các sách tham khảo được tác giả đề cập tới trong phần cuối của tài liệu này. Đây là lần biên soạn đầu tiên, chắc chắn tài liệu còn nhiều sơ sót, rất mong các bạn đọc trong quá trình học tập và các thày cô giảng dạy môn học này đóng góp các ý kiến xây dựng. Tp. Hồ Chí Minh 10/11/2007 Nhóm biên soạn Biên soạn phần xử lý âm thanh: ThS Võ Nguyễn Quốc Bảo Biên soạn phần xử lý hình ảnh: TS Nguyễn Thanh Bình Chương 1 Giới thiệu chung về xử lý tín hiệu 3 CHƯƠNG 1 GIỚI THIỆU CHUNG VỀ XỬ LÝ TÍN HIỆU 1.1 CÁC KHÁI NIỆM VÀ LÝ THUYẾT CƠ BẢN Xử lý tín hiệu là lĩnh vực khoa học được nghiên cứu và phát triển trong một thời gian dài. Hệ thống xử lý tín hiệu tương tự cũng như xử lý tín hiệu số được ứng dụng rất rộng rãi trong ngành viễn thông cũng như trong nhiều ngành khoa học khác. Trong những năm gần đây, các phương pháp xử lý tín hiệu số đang dần chiếm ưu thế, cho dù, về mặt bản chất, tín hiệu nguyên thủy được truyền đi và tín hiệu mà người nhận tin có thể tiếp thu được vẫn là tín hiệu tương tự. Xu hướng phát triển trên hình thành do hệ thống số có nhiều tính năng nổi trội của so với các hệ thống analog cổ điển: 1. Các hệ thống xử lý số có độ linh hoạt cao: có thể nhanh chóng thay đổi cơ chế hoạt động của phần cứng thông qua phần mềm điều khiển. 2. Độ ổn định cao, ít chịu ảnh hưởng của môi trường xung quanh, tính chất của hệ thống số hầu như không thay đổi theo thời gian. 3. Khả năng xử lý tín hiệu với độ chính xác cao. Tín hiệu số cho phép lưu trữ và sao chép nhiều lần với mức độ tin cậy cao. Khả năng chống nhiễu của tín hiệu số cao hơn so với tín hiệu tương tự. 4. Thời gian thiết kế và thi công các hệ thống số nhanh, kích thước nhỏ gọn, mức tiêu hao năng lượng thấp v.v. Trước đây, do tốc độ xử lý của máy tính còn chậm, việc xử lý các tín hiệu "phức tạp" như tín hiệu âm thanh chất lượng cao hay tín hiệu ảnh số không thể thực hiện được trong thời gian thực. Tuy nhiên, trong những năm gần đây, với sự phát triển mạnh mẽ của công nghệ vi điện tử, nhược điểm nêu trên đã được khắc phục. Ví dụ điển hình là DSP xử lý ảnh và âm thanh cao cấp của hãng Texac Instrument TMS320DM6446 Digital Media System-on-Chip làm việc với tần số xung nhịp 594 Mhz, cho phép thực hiện nén video theo chuẩn MPEG-2 và MPEG-4 thời gian thực ( Tốc độ xử lý của DSP này là 4752 MIPS (Million Instructions Per Second - MIPS). DSP TMS320DM6446 được tích hợp 4 kênh biến đổi DAC (54MHz) để tạo các tín hiệu video tiêu chuẩn theo hệ NTSC/PAL, S-Video cũng như video thành phần (Component video). Giá thành của DSP xử lý video chuyên dụng nói trên khoảng <45$. Hiện nay, kỹ thuật xử lý tín hiệu số đang được sử dụng rất hiệu quả trong các lĩnh vực xử lý âm thanh (nhận dạng tiếng nói, tổng hợp âm thanh và tiếng nói v.v.), xử lý ảnh (nâng cao chất lượng ảnh, phân vùng, nhận dạng .v.v), đo lường và điều khiển, thiên văn học v.v. Tài liệu hướng dẫn học tập môn xử lý âm thanh và hình ảnh này thực chất có thể được gọi là tài liệu hướng dẫn "nhập môn" xử lý âm thanh và hình ảnh. Thông thường các tài liệu nghiên cứu về xử lý ảnh và âm thanh được tách riêng vì: 1- Đây là hai lĩnh vực xử lý tín hiệu rất rộng, liên quan tới rất nhiều ngành khoa học khác nhau; 2- Quá trình xử lý tín hiệu âm thanh và hình ảnh phải được thực hiện dựa trên những hiểu biết sâu sắc về hệ thống thính giác và thị giác của con người. Ở các phần sau, ta sẽ thấy rằng đa số các kỹ thuật xử lý tín hiệu âm thanh và hình ảnh sẽ dựa trên đặc điểm tiếp thu thông tin của các giác quan nói trên; 3- Tín hiệu âm thanh và hình ảnh khác nhau về bản chất: tín hiệu âm thanh là tín hiệu một chiều còn tín hiệu hình ảnh (tĩnh hay động) là tín hiệu hai hoặc ba chiều. Chính vì thế, công cụ toán học để mô tả và phân tích quá trình xử lý hai loại tín hiệu trên cũng khác nhau. Tuy âm thanh và hình ảnh là hai tín hiệu tương đối khác nhau, nhưng quá trình xử lý chúng Chương 1 Giới thiệu chung về xử lý tín hiệu 4 vẫn được mô tả dựa trên nền tảng lý thuyết xử lý tín hiệu tổng quát. Sau đây chúng ta nhắc lại một số những khái niệm cơ bản về tín hiệu và hệ thống xử lý tín hiệu. 1.1.1 Tín hiệu và phân loại tín hiệu Tín hiệu do một thiết bị đầu cuối tạo ra, tín hiệu là biểu diễn vật lý (dòng điện, điện áp...) của tin tức, được truyền đi từ đầu phát đến đầu thu. Tín hiệu có thể được biểu diễn bằng một hàm của nhiều biến số: ( ) ( )ϕ,,, fvtftm = , f - tần số, t - thời gian, v - biên độ, ϕ - trạng thái pha. Khi phân loại tín hiệu ta có thể dựa trên các cơ sở khác nhau như phân loại theo năng lượng, hình thái, theo tính chất của phổ của tín hiệu v.v. Trong lý thuyết tín hiệu có hai lớp tín hiệu quan trọng đó là tín hiệu xác định và ngẫu nhiên. Tín hiệu xác định là tín hiệu có quá trình biến đổi biểu diễn bằng một hàm thời gian, và có thể xác định chính xác ở mọi thời điểm. Các tín hiệu xác định có vai trò rất quan trọng trong lý thuyết tín hiệu cổ điển. Tín hiệu xác định còn chia ra thành tín hiệu tuần hoàn (theo chu kỳ T) và không tuần hoàn (phi chu kỳ).Tín hiệu tuần hoàn là những tín hiệu có thể biểu diễn bằng công thức như sau: ( ) ( ) nguyeânkkTtxtx −+= - tín hiệu này tuân theo quy luật lặp lại đều với chu kỳ T. Tín hiệu ngẫu nhiên là các tín hiệu mà không thể dự kiến trước hành vi của chúng theo thời gian và để biểu diễn chúng phải dựa trên lý thuyết thống kê. Trên thực tế, các tín hiệu thông tin đều mang tính chất ngẫu nhiên. Tín hiệu có thể có biên độ và biến thời gian (không gian) là rời rạc hay liên tục, do đó chúng ta còn phân biệt bốn loại tín hiệu sau: Tín hiệu tương tự (analog) Tín hiệu lượng tử Tín hiệu rời rạc Tín hiệu số (digital) Biên độ liên tục rời rạc liên tục rời rạc Biến thời gian liên tục liên tục rời rạc rời rạc Như vậy, tín hiệu tương tự là tín hiệu có biên độ và biến thời gian là liên tục. Nếu tín hiệu được biểu diễn bằng hàm của biến rời rạc thì tín hiệu đó là tín hiệu rời rạc. Ký hiệu chung của tín hiệu rời rạc là ( )s sx nT , snT là biến độc lập, rời rạc, n là số nguyên, sT là chu kỳ lấy mẫu. Tín hiệu có biên độ và thời gian đều rời rạc được gọi là tín hiệu số, ký hiệu là ( )dx n . Ngoài ra, dựa trên tính chất của tin tức truyền đi, người ta còn phân loại các tín hiệu sau: - Tín hiệu thoại (tiếng nói con người). - Tín hiệu hình ảnh tĩnh hay ảnh động (tín hiệu video) - Tín hiệu dữ liệu (data) dùng trong hệ thống máy tính, bộ vi xử lý. Một số tín hiệu khác, phân biệt theo bề rộng phổ và tần số (tín hiệu dải rộng, dải hẹp, cao tần v.v.) cũng sẽ được định nghĩa và sử dụng trong những phần tiếp theo. 1.1.2 Tín hiệu rời rạc Tín hiệu x(t) có biến thời gian t rời rạc được gọi là tín hiệu rời rạc, chúng ta có thể ký hiệu là {xn} với n là số nguyên (n = 0, ±1, ±2, ). Chương 1 Giới thiệu chung về xử lý tín hiệu 5 1.1.2.1 Biểu diễn tín hiệu rời rạc a- Biểu diễn toán học Xét hàm x(n) với n là phần tử nguyên. Ký hiệu tín hiệu rời rạc : { ( )}x x n n= − ∞ < < +∞ ⎩⎨ ⎧ ≤≤= laïi coøn toaùn thöùc bieåu n NnN nx 0 )( 21 b- Biểu diễn bằng đồ thị Để minh hoạ theo kiểu nhìn trực quan, ta có thể vẽ đồ thị (hình 1.1.1) của dãy x(n). c- Biểu diễn bằng dãy số Chúng ta không để ở dạng chung (một tổng hay tích) mà khai triển các giá trị của tín hiệu rời rạc như sau : ),...}1n(x),n(x),1n(n{...,)n(x +−= ↑ = 0, , 4 1 , 2 1 , 4 3 1, 0 ,...},{...,)n(x ↑ : chỉ mẫu tại n = 0. 1.1.2.2 Các phép biến đổi tín hiệu rời rạc a- Phép nhân hai tín hiệu rời rạc : )}().({. nynxyx = (1.1.1) b- Phép nhân tín hiệu rời rạc với hằng số : )}(.{. nyy αα = (1.1.2) c- Phép cộng hai tín hiệu rời rạc : )}()({ nynxyx +=+ (1.1.3) d- Phép dịch (trễ) : Dãy x được dịch sang phải n0 mẫu, thành dãy y : )()( 0nnxny −= với n0 > 0 (1.1.4) Dãy x được dịch sang trái n0 mẫu, thành dãy y : )nn(x)n(y 0+= với n0 > 0 (1.1.5) Như vậy một tín hiệu x(n) bất kỳ có thể biểu diễn : ∑∞ −∞= −= k knkxnx )()()( δ (1.1.6) n -1 0 1 2 3 4 5 6 )n(x Hình 1.1.1 Tín hiệu rời rạc Chương 1 Giới thiệu chung về xử lý tín hiệu 6 e- Tín hiệu rời rạc tuần hoàn với chu kỳ là N nếu thoả mãn : )()( Nnxnx += , ∀ n. (1.1.7) Tín hiệu tuần hoàn có thể được ký hiệu với chỉ số p (period) : xp(n). Tín hiệu chỉ được xác định trong một khoảng hữu hạn N mẫu được gọi là tín hiệu có độ dài hữu hạn N. f- Tín hiệu năng lượng và tín hiệu công suất: * Năng lượng của tín hiệu được định nghĩa bằng tổng bình phương các modul : 2( )xN n E x n ∞ =−∞ = ∑ (1.1.8) * Công suất trung bình của tín hiệu rời rạc được định nghĩa như sau: 21lim ( ) 2 1 N xN N n N P x n N→∞ =− = + ∑ (1.1.9) g- Tín hiệu tuần hoàn và tín hiệu không tuần hoàn * Tín hiệu là tuần hoàn với chu kỳ N (N > 0) , nếu và chỉ nếu x(n + N) = x(n) (1.1.10) Giá trị nhỏ nhất của N được gọi là chu kỳ. x(n + kN) = x(n) ; k nguyên dương * Nếu không có giá trị N thỏa (1.1.10), thì tín hiệu gọi là không tuần hoàn. h- Tín hiệu chẵn và tín hiệu lẻ Tín hiệu x(n) được gọi là chẵn khi x(-n) = x(n) (1.1.11) Ngược lại, tính hiệu x(n) được gọi lẻ khi x(-n) = -x(n) (1.1.12) i- Phép gập tín hiệu: Thay biến n bằng (-n), kết quả ta có ( )x n thay vì ( )x n− . Phép biến đổi này thực hiện bằng cách lấy đối xứng tín hiệu ( )x n qua gốc thời gian. 1.1.3 Phân loại hệ thống 1.1.3.1 Hệ thống tương tự Quá trình biến đổi tín hiệu được thực hiện trong hệ thống xử lý tín hiệu. Các hệ thống xử lý tín hiệu được phân loại dựa vào đặc trưng của tín hiệu mà nó xử lý. Từ cách phân loại tín hiệu trên đây, ta có các hệ thống xử lý tín hiệu tương ứng như sau: Hệ thống tương tự: các mạch lọc tương tự, mạch khuyếch đại, nhân tần số, điều chế tín hiệu v.v. Hệ thống rời rạc: mạch tạo xung, điều chế xung v.v Hệ thống số: mạch lọc số.. Chương 1 Giới thiệu chung về xử lý tín hiệu 7 Ngoài ra cũng còn các hệ thống hỗn hợp khác như hệ thống biến đổi tương tự- số hay ngược lại. Tín hiệu vào và tín hiệu ra của một hệ thống quan hệ với nhau thông qua toán tử biến đổi T: ( ) ( ) ( ) ( )TT x t y t hay x t y t= ⎯⎯→⎡ ⎤⎣ ⎦ (1.1.13) 1.1.3.1.1 Các tính chất của hệ thống tương tự a) Tính tuyến tính: Hệ thống là tuyến tính khi nó có tính xếp chồng: nếu )t(ya)t(ya)t(xa)t(xa )t(y)t(x )t(y)t(x 22112211 22 11 +→+ → → (1.1.14) b) Tính bất biến theo thời gian: Hệ thống được gọi là bất biến nếu ( ) ( )y t T x t= ⎡ ⎤⎣ ⎦ thì ( ) ( )0 0y t t T x t t− = −⎡ ⎤⎣ ⎦ (1.1.15) c) Tính nhân quả Hệ thống được gọi là nhân quả nếu đáp ứng của nó tại thời điểm bất kỳ chỉ phụ thuộc vào các giá trị của tín hiệu vào ở thời điểm hiện tại và quá khứ. d) Tính ổn định: Một hệ thống được gọi là ổn định nếu tín hiệu ra giới hạn với tất cả các tín hiệu vào giới hạn. Dựa trên các tính chất đã nêu của hệ thống, chúng ta có thể phân loại các hệ thống như sau: hệ thống tuyến tính, hệ thống bất biến, hệ thống nhân quả, hệ thống tuyến tính bất biến. 1.1.3.1.2 Các hệ thống tuyến tính bất biến (LTI) Các hệ thống tuyến tính bất biến thường được biểu diễn trong miền thời gian dưới các dạng sau: - Phương trình vi phân - Phương trình trạng thái - Đáp ứng xung. Đáp ứng xung của hệ thống ( )h t là đáp ứng ra của hệ thống khi tín hiệu đưa vào là xung đơn vị. Nếu hệ thống là tuyến tính và bất biến thì tín hiệu ra của hệ thống có thể tìm được thông qua tích chập giữa tín hiệu vào và hàm đáp ứng xung: ( ) ( ) ( ) ( ) ( )y t x t h t x h t dτ τ τ∞ −∞ = ∗ = −∫ (1.1.16) Các tính chất của hệ thống LTI Tính nhân quả Hệ thống LTI là nhân quả nếu ( ) 0h t = với t∀ và ngược lại nếu ( ) 0h t = với t∀ thì hệ thống là nhân quả. Chương 1 Giới thiệu chung về xử lý tín hiệu 8 Tính ổn định của hệ thống LTI Cho tín hiệu vào hệ thống được giới hạn biên độ: ( ) xx t M≤ < ∞ , xM là hằng số. Trong trường hợp này, hệ thống sẽ là ổn định nếu đáp ứng xung của nó thỏa mãn điều kiện: ( )h t dt∞ −∞ < ∞∫ . Điều kiện này là cần và đủ để hệ thống LTI là ổn định. Hệ thống LTI không nhớ: hệ thống tuyến tính bất biến là không nhớ nếu ( ) 0h t = với 0t ≠ . 1.1.3.1.3 Phương trình sai phân tuyến tính hệ số hằng Cho ( )x t và ( )y t là tín hiệu vào ra của hệ thống tuyến tính bất biến. Phương trình sai phân tuyến tính hệ số hằng tổng quát của hệ thống có thể biểu diễn dưới dạng: ( ) ( ) ( ) ( ) 0 0 N M k r k r k r a y t b x t = = =∑ ∑ (1.1.17) N, M là số nguyên dương, N là bậc của phương trình. Nghiệm đầy đủ của phương trình bằng tổng nghiệm riêng ( )ry t và nghiệm thuần nhất ( )0y t : ( ) ( ) ( )0ry t y t y t= + . Trong đó nghiệm thuần nhất ( )0y t là nghiệm của phương trình thuần nhất: ( ) ( ) 0 0 N k k k a y t = =∑ . (1.1.18) 1.1.3.2 Hệ thống rời rạc Hệ thống rời rạc được đặc trưng bởi toán tử T làm nhiệm vụ biến đổi dãy vào ( )x n (là tín hiệu rời rạc) thành dãy ra ( )y n . Toán tử T cho chúng ta thấy quan hệ vào ra của hệ thống. Chúng ta có hai cách để biểu diễn toán tử T: ( ) ( ) ( ) ( )TT x t y t hay x t y t= ⎯⎯→⎡ ⎤⎣ ⎦ (1.1.19) Dãy vào còn được gọi là kích thích, còn dãy ra là đáp ứng của hệ thống đối với kích thích đang khảo sát. 1.1.3.2.1 Hệ thống rời rạc tuyến tính bất biến (LTI) a. Hệ thống tuyến tính Hệ thống tuyến tính là hệ thống mà quan hệ vào ra của hệ thống thoả mãn nguyên lý xếp chồng. Với ( )1x n và ( )2x n là các chuỗi vào bất kỳ, ( )1y n và ( )2y n là các chuỗi ra tương ứng. Hệ thống được gọi là tuyến tính khi: 1 1 2 2 1 1 2 2 1 1 2 2 ( ) ( ); ( ) ( ) ( ) ( ) ( ) ( ) T T T x n y n x n y n a x n a x n a y n a y n ⎯⎯→ ⎯⎯→ + ⎯⎯→ + (1.1.20) trong đó a1, a2 là các hằng số. Chương 1 Giới thiệu chung về xử lý tín hiệu 9 b. Hệ thống tuyến tính bất biến Nếu ( )y n là đáp ứng của kích thích ( )x n thì hệ thống tuyến tính gọi là bất biến khi ( )y n k− là đáp ứng của hệ thống đối với kích thích ( )x n k− . Nếu biến số là thời gian thì ta có hệ thống bất biến theo thời gian. Đối với hệ thống bất biến, khi kích thích giống nhau thì ... ............................................................... 50 2.3.2.2 Cấu trúc của giải thuật dùng mô hình LPC ........................................................... 53 2.4 PHÂN TÍCH CHẤT LƯỢNG XỬ LÝ THOẠI .......................................................... 54 2.4.1 Các phương pháp mã hoá ......................................................................................... 54 2.4.2 Các tham số liên quan đến chất lượng thoại ............................................................. 55 2.4.3 Các phương pháp đánh giá chất lượng thoại cơ bản ................................................. 55 2.4.3.1 Phương pháp đánh giá chủ quan (MOS) ............................................................... 57 2.4.3.2 Các phương pháp so sánh dựa trên mô hình giác quan ......................................... 58 2.5 MÔ HÌNH ỨNG DỤNG XỬ LÝ THOẠI ................................................................... 62 2.5.1 Mô hình thời gian động ............................................................................................ 62 2.5.1.1 Tổng quan .............................................................................................................. 62 2.5.1.2 Giải thuật DTW đối xứng ...................................................................................... 63 2.5.1.3 Giải thuật DTW bất đối xứng ................................................................................ 65 2.5.2 Mô hình chuỗi markov ẩn ......................................................................................... 67 2.5.2.1 Tổng quan .............................................................................................................. 67 2.5.2.2 Định nghĩa mô hình Markov ẩn ............................................................................. 67 2.5.2.3 Ứng dụng HMM trong việc nhận dạng âm thoại liên tục ...................................... 68 2.5.3 Mạng nơron .............................................................................................................. 69 2.5.3.1 Tổng quan .............................................................................................................. 69 2.5.3.2 Phương pháp học của não người ........................................................................... 69 2.5.3.3 Từ neuron người đến neuron nhân tạo ................................................................... 70 2.5.3.4 Ứng dụng mạng neuron trong nhận dạng tiếng nói ............................................... 71 CHƯƠNG 3 KỸ THUẬT XỬ LÝ HÌNH ẢNH ......................................................... 80 3.1 TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ .......................................................................... 80 3.1.1 Khái niệm cơ bản về xử lý ảnh ................................................................................. 80 3.1.2 Lĩnh vực ứng dụng kỹ thuật xử lý ảnh...................................................................... 80 3.1.3 Các giai đoạn chính trong xử lý ảnh ......................................................................... 82 3.1.4 Các phần tử của hệ thống xử lý ảnh số ..................................................................... 83 3.1.5 Biểu diễn ảnh số ....................................................................................................... 85 3.1.5.1 Ánh sáng, màu sắc và hình ảnh ............................................................................. 85 3.1.5.2 Màu sắc và các thông số đặc trưng ........................................................................ 88 3.1.5.3 Các định luật trộn màu cơ bản ............................................................................... 89 Chương 4 Ứng dụng kỹ thuật xử lý âm thanh và hình ảnh trong viễn thông 243 3.1.5.4 Không gian màu RGB ........................................................................................... 90 3.1.5.5 Hệ thống thị giác .................................................................................................... 93 3.1.5.6 Biểu diễn tín hiệu hình ảnh trong không gian và thời gian .................................... 96 3.1.5.7 Tín hiệu video ........................................................................................................ 97 3.1.5.8 Biểu diễn tín hiệu ảnh số ....................................................................................... 101 3.1.6 Lý thuyết toán ứng dụng trong xử lý ảnh và video số .............................................. 102 3.1.6.1 Các toán tử không gian .......................................................................................... 103 3.1.6.2 Các phép tính với vector và ma trận ...................................................................... 104 3.1.6.3 Biểu diễn hệ thống tuyến tính bằng ma trận .......................................................... 108 3.1.6.4 Biến đổi không gian tín hiệu .................................................................................. 111 3.2 PHÂN TÍCH CÁC KỸ THUẬT XỬ LÝ ẢNH VÀ VIDEO ...................................... 115 3.2.1 Khái niệm về quan hệ giữa các điểm ảnh ................................................................. 115 3.2.1.1 Các điểm ảnh lân cận ............................................................................................. 115 3.2.1.2 Mối liên kết (connectivity) .................................................................................... 115 3.2.1.3 Toán tử xử lý điểm ảnh .......................................................................................... 116 3.2.2 Các phương pháp nâng cao chất lượng ảnh .............................................................. 117 3.2.2.1 Nâng cao chất lượng ảnh bằng toán tử điểm ......................................................... 117 3.2.2.2 Nâng cao chất lượng ảnh bằng toán tử không gian ............................................... 128 3.2.3 Khôi phục ảnh ........................................................................................................... 133 3.2.3.1 Mô hình hóa quá trình gây méo và khôi phục ảnh ................................................ 133 3.2.3.2 Mô hình nhiễu ........................................................................................................ 134 3.2.3.3 Triệt nhiễu bằng phương pháp lọc không gian ...................................................... 136 3.2.3.4 Triệt nhiễu trong miền tần số ................................................................................. 137 3.2.3.5 Kỹ thuật lọc ngược (inverse filter) ....................................................................... 139 3.2.3.6 Lọc Wiener ............................................................................................................ 140 3.2.4 Các phương pháp xác định và dự đoán biên ảnh ...................................................... 142 3.2.4.1 Cơ sở phát hiện đường biên ảnh ............................................................................ 142 3.2.4.2 Phương pháp Gradient ........................................................................................... 143 3.2.4.3 Làm nổi biên bằng toán tử la bàn .......................................................................... 147 3.2.4.4 Kỹ thuật Laplace .................................................................................................... 148 3.2.5 Phân vùng ảnh .......................................................................................................... 152 3.2.5.1 Tổng quan về phân vùng ảnh ................................................................................. 152 3.2.5.2 Phân vùng ảnh dựa theo đường biên ..................................................................... 152 3.2.5.3 Phân vùng dựa trên xử lý ngưỡng (biên độ) (Thresholding) ................................. 156 3.2.6 Xử lý ảnh màu .......................................................................................................... 160 3.2.6.1 Các hệ màu cơ bản ................................................................................................. 160 3.2.6.2 Một số kỹ thuật xử lý ảnh màu căn bản ................................................................. 164 Chương 4 Ứng dụng kỹ thuật xử lý âm thanh và hình ảnh trong viễn thông 244 3.2.6.3 Nhiễu trong ảnh màu ............................................................................................. 175 3.3 CÁC KỸ THUẬT NÉN ẢNH ..................................................................................... 176 3.3.1 Giới thiệu chung về kỹ thuật nén ảnh ....................................................................... 176 3.3.2 Dư thừa trong tín hiệu ............................................................................................... 176 3.3.2.1 Độ dư thừa số liệu.................................................................................................. 176 3.3.2.2 Tiêu chí đánh giá chất lượng hình ảnh .................................................................. 177 3.3.3 Mô hình hệ thống nén tín hiệu .................................................................................. 178 3.3.4 Các phương pháp nén không tổn hao (lossless data reduction) ................................ 179 3.3.4.1 Phương pháp mã hóa Huffman .............................................................................. 179 3.3.4.2 Phương pháp mã LZW (Lempel-Ziv-Welch) ........................................................ 179 3.3.4.3 Phương pháp mã hóa loạt dài (RLC - Run Length Coding) .................................. 180 3.3.4.4 Phương pháp mã hóa theo vùng đồng trị ............................................................... 180 3.3.4.5 Phương pháp mã dự đoán không tổn thất .............................................................. 180 3.3.5 Các phương pháp nén tổn hao (loss data reduction) ................................................. 181 3.3.5.1 Phương pháp mã dự đoán có tổn hao .................................................................... 181 3.3.5.2 Các phương pháp nén sử dụng phép biến đổi không gian tín hiệu ........................ 182 3.3.5.3 Các chuẩn nén ảnh tính và ảnh động ..................................................................... 183 3.3.5.4 Phương pháp nén ảnh tĩnh theo chuẩn JPEG ......................................................... 184 3.3.5.5 Nén JPEG lũy tiến ................................................................................................. 190 3.3.5.6 Các tham số tiêu chuẩn của phương pháp nén JPEG ............................................ 192 3.3.5.7 Phương pháp nén ảnh động theo chuẩn M-JPEG .................................................. 192 3.3.6 Chuẩn nén ảnh động MPEG .................................................................................... 193 3.3.6.1 Kỹ thuật xử lý tín hiệu trong MPEG ..................................................................... 193 3.3.6.2 Mã hóa tín hiệu MPEG .......................................................................................... 196 3.3.6.3 Giải mã tín hiệu MPEG ......................................................................................... 197 3.3.6.4 Các thành phần cơ bản trong ảnh nén MPEG ........................................................ 197 3.3.6.5 Tiêu chuẩn nén MPEG-2 ....................................................................................... 198 3.3.7 Tiêu chuẩn nén MPEG-4 .......................................................................................... 199 3.3.7.1 Video trong MPEG-4 ............................................................................................. 201 3.3.7.2 Cấp độ của video MPEG-4 .................................................................................... 201 3.3.7.3 Mã hóa đường nét (shape) ..................................................................................... 201 3.3.7.4 Mã hóa texture ....................................................................................................... 202 3.3.7.5 Sprites .................................................................................................................... 202 3.3.7.6 Scalability .............................................................................................................. 203 3.3.8 Ứng dụng và đánh giá khả năng kinh tế của các tiêu chuẩn nén .............................. 203 Chương 4 Ứng dụng kỹ thuật xử lý âm thanh và hình ảnh trong viễn thông 245 CHƯƠNG 4 ỨNG DỤNG KỸ THUẬT XỬ LÝ ÂM THANH VÀ HÌNH ẢNH TRONG VIỄN THÔNG 4.1 CÁC ỨNG DỤNG CỦA XỬ LÝ ÂM THANH VÀ HÌNH ẢNH .............................. 211 4.1.1 Lưu trữ âm thanh và hình ảnh ................................................................................... 211 4.1.1.1 Băng từ .................................................................................................................. 211 4.1.1.2 Đĩa quang ............................................................................................................... 214 4.1.1.3 Lưu trữ dữ liệu trên hệ thống đĩa từ (hard disk) .................................................... 218 4.1.2 Phân phối nội dung qua mạng viễn thông ................................................................ 220 4.1.2.1 Phân phối nội dung qua kênh vô tuyến .................................................................. 220 4.1.2.2 Truyền thanh quảng bá .......................................................................................... 221 4.1.2.3 Truyền hình quảng bá ............................................................................................ 224 4.1.2.4 Phân phối nội dung qua kênh hữu tuyến ............................................................... 228 4.2 CÁC TIÊU CHUẨN MÃ HÓA ÂM THANHVÀ HÌNH ẢNH TRONG TRUYỀN THÔNG ĐA PHƯƠNG TIỆN..................................................... 233 4.2.1 Các tiêu chuẩn của ITU- T cho âm thanh ................................................................. 233 4.2.2 Các tiêu chuẩn của ITU- T cho ảnh tĩnh và video. ................................................... 236 4.2.2.1 Chuẩn H261 ........................................................................................................... 236 4.2.2.2 Chuẩn H.262 .......................................................................................................... 236 4.2.2.3 Chuẩn H263 ........................................................................................................... 236 4.2.2.4 Chuẩn H264 ........................................................................................................... 237 4.2.2.5 Chuẩn JVT ............................................................................................................. 237
File đính kèm:
- giao_trinh_huong_dan_hoc_tap_xu_ly_am_thanh_va_hinh_anh_hoc.pdf