Multimedia - Các kỹ thuật trong đa phương tiện
Các kỹ thuật trong đa phương tiện
Các kỹ thuật điều khiển
Các kỹ thuật thu nhận
Các kỹ thuật lưu trữ
Các kỹ thuật xử lý
Các kỹ thuật hiển thị
Các kỹ thuật truyền dữ liệu
Bạn đang xem 20 trang mẫu của tài liệu "Multimedia - Các kỹ thuật trong đa phương tiện", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Multimedia - Các kỹ thuật trong đa phương tiện
84 3. Các kỹ thuật trong đa phương tiện Các kỹ thuật điều khiển Các kỹ thuật thu nhận Các kỹ thuật lưu trữ Các kỹ thuật xử lý Các kỹ thuật hiển thị Các kỹ thuật truyền dữ liệu 85 Quá trình xử lý thông tin Multimedia Quá trình Multimedia thực hiện thao tác trên các đổi tượng Multimedia: Văn bản, các số Âm thanh: tiếng ồn, tiếng nói, âm nhạc Hình ảnh tính: đồ họa, ảnh tĩnh Hình ảnh động: video, animation Quá trình xử lý thông tin Multimedia Thu nhận thông tin: thông qua các thiết bị đầu vào Xử lý thông tin: thông qua bộ xử lý Lưu trữ thông tin: các thiết bị lưu trữ Hiển thị thông tin: các thiết bị ra Trao đổi thông tin: các thiết bị truyền thông 86 3.1 Các kỹ thuật điều khiển Bàn phím Thiết bị ngoại vi được mô hình một phần theo bàn phím máy đánh chữ. Về hình dáng, bàn phím là sự sắp đặt các nút hay phím. Các ký tự được khắc lên bàn phím Mỗi một phím tương ứng với một ký hiệu, tuy nhiên có thể kết hợp nhiều phím lại với nhau. Bàn phím được sử dụng để tạo ra ký tự, nhưng trong nhiều trường hợp có thể đưa ra lệnh thực thi. Bàn phím chuẩn: 101-key US hay 104-key Windows gồm các chữ, số và một vài biểu tượng đặc biệt. Gaming and Multimedia: Bàn phím có một số nút mở rộng phục vụ cho mục đích nghe nhạc, lướt web v.v 87 3.1 Các kỹ thuật điều khiển Bàn phím Menbrane keyboard Hoạt động dựa trên tiếp xúc của lớp bề mặt với mạch điện phía dưới. Sử dụng từ những năm 1980 trong các máy tính gia đình như Z80, Z81, Atari 400. Giá thành tốt, có khả năng chống bụi và chất lỏng, tuy nhiên khả năng tạo cảm giác kém gây khó khăn cho người dùng. Thích hợp các thiết bị nút như remote điều khiển từ xa, lò vi sóng hay điện thoại di động. 88 3.1 Các kỹ thuật điều khiển Bàn phím Dome-switch keyboard Kết hợp bàn phím menbrane và bàn phím cơ học. Gốm hai bản mạch nằm bên dưới một nút tròn cao sư có bọc trì. Khi phím được ấn, mạch sẽ đòng và truyền tín hiệu đi. Được sử dụng trong nhiều thiết bị điều khiển cầm tay như video game console Scissor-switch keyboard Là trường hợp đặc biệt của dome-switch. Phím được đưa vào giữa hai miếng nhựa giống như một cái kéo. Có các nút hình cao su ngắn so với trường hợp dome-switch, khoảng cách di chuyển của các phím chỉ vào 2 mm. Được sử dụng làm bàn phím laptop. 89 3.1 Các kỹ thuật điều khiển Bàn phím Roll-up keyboad Bàn phím nhựa deo có thể cuộn lại. Vật liệu sử dụng có thể là silicon chỉ đứt khi chịu tác dụng lực mạnh. Được bọc lớp vỏ cao sư khiến nó có khả năng chống nước giống như membrane. Nó ít tạo cảm giác cho người dùng. Bàn phím thông thường Không chỉ có các bộ chuyển mạch giống nhu dome-switch mà còn có bộ vi xử lý thường là chip 8048 cho phép bàn phím có thể cung cấp nhiều tính năng đặc biệt. Nó xử lý các tín hiệu đến và các đèn caps lock, num lock, scroll lock. Vấn đề: Nhấn một phím có thể tạo cảm giác đóng mạch nhiều lần. 3 phím ấn cùng một lúc Kết nối qua cổng PS/2 hoặc USB 90 3.1 Các kỹ thuật điều khiển Chuột Chuột bi Bill English phát minh năm 1972. Cấu tạo gồm 1 viên bi cao su và hai con lăn ở hai bên xác định vị trí lên xuống, sang trái phải. Chuyển động biến thành tín hiệu và truyền tới máy tính thông qua dây dẫn và chuyển thành tọa độ x, y trên màn hình hiển thị. Chuột quang Sử dung diot và photo diot để xác định chuyển động tương đối trên mặt phẳng. Chuột quang hiện đại có bộ cảm biến cho phép ghi nhận hình ảnh bề mặt chuyển động, kèm theo một chip có khả năng xử lý ảnh để xác định vị trí chuyển động. 91 3.1 Các kỹ thuật điều khiển Chuột Chuột kết nối qua cổng PS/2 gồm 6 chân mini-DIM, ở chế độ bình thường chuột PS/2 sẽ truyền tín hiệu truyền động và trạng thái của các nút bấm bằng một gói tin 3 bytes, có dạng như sau 92 3.1 Các kỹ thuật điều khiển 93 3.1 Các kỹ thuật điều khiển Bút quang học Hỗ trợ vẽ trên máy tính và có khả năng hoạt động như chuột, nhưng có yêu cầu đặc biệt về bàn để. Kết nối với máy tính thông qua cổng USB. Nhược điểm: khó sử dụng và giá thành tương đối cao. Touchscreen Có tác dụng tương tác trực tiếp với vật hiển thị. Được thiết kế chủ yếu cho các thiết bị PDA, mobile phone hoặc video game. Đặc tính của nó là có thể nhận được tay người ấn lên và chuyển thành lệnh thực thi. Phân loại: Resistive touchscreen Surface acoustic wave Capacitive 94 3.1 Các kỹ thuật điều khiển Joystick Joystick là thiết bị ngoại vi cho phép điều khiển cả hướng và góc, được sử dụng chủ yếu trong trò chơi điện tử và có một hoặc nhiều nút ấn. Thay đổi vị trí trái – phải: dịch theo trục X. Thay đổi vị trí trước – sau: dịch theo trục Y. Quay vòng theo hoặc ngược chiều kim đồng hồ: dịch theo trục Z. Một số loại Joystick có khả năng force feedback, cho phép máy tính có thể trả tín hiệu ngược lại gây ra rung động trên joystick. Joystick được kết nối với máy tính thông qua cổng USB. Hat switch: để điều khiển một số loại joystick, trong nhiều trường hợp nó cho phép nhìn xung quang khi người chơi tham gia vào thế giới ảo như trong các chương trình mô phỏng lái máy bay 95 3.2 Các kỹ thuật thu nhận Máy scanner Máy quét scanner là thiết bị cho phép chụp ảnh quang học các văn bản, chữ viết tay hay ảnh và chuyển nó sang dạng ảnh số, lưu trữ trong máy tính. Sử dụng công nghệ: CCD (Charge-coupled device) CIS (Contact Image Sensor) 96 3.2 Các kỹ thuật thu nhận Máy scanner CCD Shift register tương tự cho phép truyền tín hiệu tương tự và được điểu khiển bởi xung đồng hồ. Ngày nay nó thường được sử dụng làm bộ cảm biến ánh sáng quang điện. Về nguyên tắc hoạt động CCD có thể chia ra làm hai miền: miền quang hoạt và miền truyền. CCD được sử dụng trong máy ảnh kỹ thuật số, camera, scanner quang như các thiết bị cảm biến ánh sáng. CCD tương đối nhạy với tia hồng ngoại, gây ra hiện tượng mắt đỏ trên ảnh. CIS Được sử dụng trong các máy desktop scanner, CIS sử dụng hệ thống đèn LED đỏ, lục, lam để chiếu sáng. CIS thường sử dụng ít năng lượng hơn cho nên có thể áp dụng cho một số scanner có nguồn cung điện thế thấp. CIS cho chất lượng ảnh kém hơn, nhưng lại cho cấu trúc tương đối nhỏ gọn, tất cả các thành phần cần thiết đều có thể tích hợp trong một môđun duy nhất. CIS được sử dụng trong đọc mã vạch và một số các thiết bị nhận dạng. 97 3.2 Các kỹ thuật thu nhận Máy ảnh số Máy ảnh số thường gọi là máy ảnh kỹ thuật số là một thiết bị điện tử dùng để thư và lưu giữ hình ảnh một cách tự động thay vì dùng phim ảnh giống như máy chụp ảnh thường. Phân loại Máy chụp ảnh số xem ngay Máy chụp ảnh số gọn Máy chụp ảnh số chuyên nghiệp dạng rời Độ phân giải ảnh Độ phân giải của máy chụp ảnh số thường được quyết định bởi bộ cảm biến, đó là phần đổi ánh sáng thành những tín hiệu rời rạc. Một thuộc tính quan trọng của máy chụp ảnh số là số pixel của nó, tính theo hàng triệu gọi là megapixel. Tỉ lệ kích thước ảnh có thể là 4:3 hoặc 3:2. 98 3.2 Các kỹ thuật thu nhận Máy ảnh số Độ phân giải ảnh 99 3.2 Các kỹ thuật thu nhận Máy ảnh số Các phương pháp thu ảnh Phương pháp chụp một lần Phương pháp thứ hai gọi là chụp nhiều lần Phương pháp thứ ba là quét ảnh giống như desktop scanner Lưới lọc màu, nội suy, chống răng cưa 100 3.2 Các kỹ thuật thu nhận Camera số và Webcam Camera số: Nhận trực tiếp thông tin video số Lưu trữ thông tin video dạng số Ưu điểm của video số: Dễ dàng đưa vào máy tính và xử lý Nén video là nén mất mát thông tin Không sử dụng băng từ, do đó làm thu nhỏ thiết bị Nhìn trực quan video thu được Không giảm chất lượng khi sao chép Nhược điểm Độ phân giải thấp Giá bộ nhớ cao Webcam Camera số có chất lượng thấp Gắn trực tiếp vào máy tính Cho phép tương tác trực tiếp với Internet Độ phận giải thấp – 640 x 480 300.000 pixel 101 3.3 Các kỹ thuật lưu trữ Đĩa CD Đĩa CD là một trong những loại đĩa quang học, chúng thường được chế tạo bằng chất dẻo có đường kính là 4,75 inch, dùng phương pháp ghi quang học để lưu trữ khoảng 80 phút âm thanh hoặc 700 MB dữ liệu máy tính đã được mã hóa theo kỹ thuật số. Đặc điểm Tốc độ quét: 1.2 – 1.4 m/s Độ dài rãnh: 1.6 µm Đường kính đĩa: 120 mm Độ dày: 1.2 mm Bán kính trong của vùng lưu trữ: 25 mm Bán kính ngoài của vùng lưu trữ: 58 mm Đường kính lỗ trục: 15 mm 102 3.3 Các kỹ thuật lưu trữ Đĩa CD Cấu tạo của đĩa CD gồm có 3 lớp: Một lớp nhựa Một lớp bảo vệ bề mặt Một lớp màng kim loại phản xạ Các vết dữ liệu được khắc lên lớp màng kim loại theo các lỗ có độ sâu 0.83µm, độ cách quãng: 1.6µm. Các vết khắc thể hiện các mã nhị phân: vùng bằng tương ứng bit 0, sự biến đổi từ vùng cao sang vùng thấp hoặc từ vùng thấp sang vùng cao tương ứng bit 1. 103 3.3 Các kỹ thuật lưu trữ Đĩa CD Cấu trúc dữ liệu Đơn vị lưu trữ nhỏ nhất trong CD là frame gồm 33 byte: 6 mẫu 16 bit stereo (2 byte x 2 kênh x 6 mẫu = 24 byte). 8 byte sửa lỗi CIRC (Cross-interleaved Reed-Solomon coding) 1 byte lưu thông tin điều khiển và hiển thị Mỗi byte được chuyển thành 14 bit theo phương pháp điều chế eight-to- fourteen. + 3 bit bổ trợ tạo thành 17 bit. Như vậy tổng cộng có 33 x (14+3) = 561 bit + 27 bit đồng bộ = 588 bit cho một frame. Các frame được nhóm lại tạo thành sector: Mỗi sector có 98 frame tương đương 2352 (98x24) byte âm nhạc. Đầu đọc CD có khả năng quét 75 sector/s ~ 176.400 byte/s. Chia cho hai kênh và hai byte cho một mẫu chúng ta có tốc độ là 44,100 mẫu/s. 104 3.3 Các kỹ thuật lưu trữ Đĩa CD Điều chế eight-to-fourteen Không có hai bit 1 nằm kề nhau, tối thiểu phải cách 2 bit 0 để tránh bước chuyển và làm giảm tốc độ đọc. Như vậy thời gian tối thiểu để xảy ra bước chuyển là 3T (T = 231.4 ns) Thời gian tối đa xảy ra bước chuyển là 11 T (chuỗi 14 bit có hơn 10 bit 0 nằm giữa hai bit 1). 105 3.3 Các kỹ thuật lưu trữ Đĩa CD Các chuẩn CD ISO 9660. Dùng lưu trữ thông tin Multimedia. Music Disc SACD (Super Audio CD) CD-Text CD-I (Compact Disc interative) CD-ROM XA CD-I Bridge CD-R Video CD (VCD) Mini CD 106 3.3 Các kỹ thuật lưu trữ Đĩa CD CD-DA Được giới thiệu lần đầu tiên vào những năm 1980 bởi Sony và Philips Lưu trữ âm thanh số: 44.1 KHz và 16 bit. Một sector (block) chứa 98 dải 24 octect tương được bới 2.352 octet (1/75 giây âm nhạc): là đơn vị nhỏ nhất trên đĩa CD-DA. CD-DA: 747 MB, 1-99 rãnh, mỗi rãnh chứa 300 sector. Tốc độ dữ liệu: 44.1 KHz tần số lấy mẫu, 16 bit mã hóa, 2 kênh 44100 x 16 x 2 = 1411200 bit/s Dung lượng: 1411200 x 60 x 70 = 747 MB Kiểm soát lỗi bằng CICR và EFM 107 3.3 Các kỹ thuật lưu trữ Đĩa CD CD-ROM Dược giới thiệu lần đầu tiên vào năm 1983 bởi Sony và Philips Mỗi khối thông tin chứa 98 khung dữ liệu, mỗi khung dài 24 octet, cho ta 2.352 octet dữ liệu Có hai chế độ: chứa dữ liệu tin học và âm thanh Trong chế độ thứ nhất: các dữ được tăng thêm tính sửa lỗi và phát hiện lỗi: tỉ lệ bit lỗi: 10-15. Khuôn dạng dữ liệu có: 12 byte Sync, 4 byte Hearder, 8 byte dự phòng, 2048 byte dữ liệu, 276 byte sửa lỗi và 4 byte phát hiện lỗi. Trong chế độ thứ 2: toàn bộ 2336 byte dữ liệu, 16 byte đầu giống chế độ thứ nhất. Tốc độ đọc khối: 75 khối/s; data rate: chế độ thứ nhất: 150 KBps, chế độ thứ hai: 171 KBps. Dung lượng Chế độ thứ nhất: 74 x 60 x 75 x 2048 = 650 MB. Chế độ thứ hai: 74 x 60 x 75 x 2336 = 742 MB. 108 3.3 Các kỹ thuật lưu trữ DVD Còn gọi là Digital Versatile Disc hoặc Digital Video Disc được phát minh vào năm 1995. Nó dùng để lưu dữ liệu và video. DVD có cùng kích thước với CD nhưng dung lượng của nó gấp 6 lần. Phân loại DVD-5: có một mặt và một lớp lưu thông tin, khả năng lưu trữ 4.7 GB. DVD-9: có một mặt và hai lớp lưu thông tin, khả năng lưu trữ là 8.5 GB. DVD-10: có hai mặt và mỗi mặt có một lớp lưu thông tin, khả năng lưu trữ 9.4 GB. DVD-9: có hai mặt và mỗi mặt có hai lớp lưu thông tin, khả năng lưu trữ là 17 GB. Blu-ray Blu-ray sử dụng ánh sáng laser xanh với bước sóng 405 nm để đọc và viết dữ liệu Hard-coating 109 3.3 Các kỹ thuật lưu trữ Hard disk driver HDD là thiết bị lưu trữ dữ liệu trên bề mặt các tấm đĩa hình tròn phủ vật liệu từ tính, thuộc dạng bộ nhớ “không thể xâm phạm”, có nghĩa là chúng không bị mất dữ liệu khi ngừng cung cấp nguồn điện. Cấu tạo 110 3.3 Các kỹ thuật lưu trữ Hard disk driver Hoạt động Head: Đầu đọc/ghi di chuyển trên bề mặt đĩa Grain: Các thành phần hạt từ và phương của chúng sắp xếp đồng hướng trong một khoảng. R, N: vị trí từ ngược/thuận (theo quy ước) Magnetic Field lines: Đường sức từ (khi không có đầu đọc/ghi) Binary value encoded: Giá trị tín hiệu nhị phân (0101) nhận được 111 3.3 Các kỹ thuật lưu trữ Hard disk driver Một số thông số của ổ đĩa Dung lượng và tốc độ Thời gian tìm kiếm trung bình: là khoảng thời giant rung bình (đơn vi ms) mà đầu đọc có thể di chuyển từ một cylinder này đến cylinder khác ngẫu nhiên. Thời gian truy cập ngẫu nhiên: là thời giant rung binh để đĩa cứng tìm kiếm một dữ liệu ngẫu nhiên, tính băng ms (số liệu năm 2007 là từ 5-15 ms). Thời gian làm việc tin cậy: MTBF (Mean time between failures) có thể hiểu là tuổi thọ của ổ đĩa cứng tính theo đơn vị giờ. Bộ nhớ đệm: giống như RAM trong máy tính, đầu đọc ghi đọc dữ liệu và lưu vào trong bộ nhớ tạm. 112 3.3 Các kỹ thuật lưu trữ Hard disk driver Chuẩn giao tiếp vật lý SCSI (Small Computer System Interface) ATA (Advanced Technology Attactment) tốc độ truyền dữ liệu tối đa là 133 MB/s SATA (Serial ATA) tốc độ truyền theo chuyền 150 MB/s, tuy nhiên ATA II cho phép tốc tộ lên đến 150 MB/s còn ATA III, tốc độ có thể đạt được là 600 MB/s. 113 3.4 Các kỹ thuật xử lý CPU – Central Processing Unit Intel 4004 ra đời vào năm 1970, nâng cấp lên thành Intel 8080 và ứng dụng trong máy tính cá nhân và mainframe. Định luật Moore: số lượng transistor trên một bo mạch tăng lên gấp đôi cứ sau 1 năm. Máy tính đời mới như máy tính lượng tử, máy tính được tăng cường khả năng tính toán song song. Cấu tạo: Bộ điều khiển: điều khiển hoạt động xử lý, được điều tiết chính xác bởi xung nhịp đồng hồ. Thanh ghi: phần tử nhớ tạm trong bộ vi xử lý Bộ số học – logic: thực hiện các phép toán logic và số học 114 3.4 Các kỹ thuật xử lý CPU – Hoạt động Nhận lệnh CPU đưa địa chỉ của lệnh cần nhận từ bộ đếm chương trình PC ra bus địa chỉ. CPU phát tín hiệu điều khiển đọc bộ nhớ Lệnh từ bộ nhớ được đặt lên bus dữ liệu và được CPU copy vào thanh ghi lệnh IR CPU tăng nội dung PC để trỏ sang lệnh kế tiếp 115 3.4 Các kỹ thuật xử lý CPU – Hoạt động Giải mã lệnh Lệnh từ thanh ghi lệnh IR được đưa đến đơn vị điều khiển Đơn vị điều khiển tiến hành giải mã lệnh để xác định các thao tác phải thực hiện Giải mã lệnh xảy ra bên tro ... ch thước khối thông tin sau khi nén với kích thước trước khi nén. Chất lượng nén: Nén mất thông tin. Nén không mất thông tin. Chất lượng cảm nhận thông tin Tốc độ của các thuật toán: Tốc độ nén. Tốc độ giải nén. 137 Nén không mất thông tin Phương pháp nén không mất thông tin cho phép khôi phục lại hoàn toàn khối dữ liệu ban đầu qua các chu trình nén – giải nén. Đòi hỏi phải có thiết bị lưu trữ và đường truyền lớn Các thuật toán của nén không mất dữ liệu dựa vào việc thay thế một nhóm các ký tự trùng lặp bởi một nhóm các ký tự đặc biệt khác ngắn hơn không quan tâm tới ý nghĩa của dữ liệu Run-Length Encoding (RLE), Huffman Coding, Arithmetic coding, Shannon-Fano Coding, LZ78, LZH, LZW ... 138 Nén không mất thông tin Ba dạng thuật toán nén không mất thông tin: Các thuật toán mã hoá thống kê: Các thuật toán này hoạt động dựa trên tần suất xuất hiện của các ký tự mã trong khối thông tin. Giảm số lượng bit dùng để biểu diễn các ký tự mã xuất hiện thường xuyên. Tăng số lượng bit dùng để biểu diễn những ký tự mã ít xuất hiện. Các thuật toán dựa trên sự thay thế các chuỗi: các thuật toán này nén các chuỗi chứa các ký tự đồng nhất. Các thuật toán dựa trên từ điển: Giảm số lượng các bit dùng để chứa các từ xuất hiện thường xuyên. Tăng số lượng các bit để chứa các từ xuất hiện thưa thớt. Các đặc tính: Thuật toán đơn giản. Tỷ lệ nén thấp. Thích hợp với nén ảnh và văn bản. 139 Các phương pháp nén không mất thông tin Phương pháp nén Shannon-Fano. Nguyên lý: Các từ mã có độ dài biến thiên. Độ dài mã tỷ lệ nghịch với xác suất xuất hiện của ký tự. Từ mã được giải mã một cách duy nhất. Thuật toán: Xác định các xác suất xuất hiện của các ký tự trong bản tin. Sắp xếp các ký tự theo trình tự xác suất xuất hiện giảm dần. Phân chia các ký tự thành hai nhóm có tổng xác suất xấp xỉ(nếu dùng mã nhị phân thì phân chia làm hai nhóm, nếu mã cơ số m thì chia làm m nhóm). Gán cho mỗi nhóm ký hiệu mã 0 hoặc 1. Tiếp tục phân chia cho tới khi trong các nhóm chỉ chứa một ký hiệu. Từ mã cho ký hiệu là tổ hợp của các ký hiệu của các nhóm chứa ký hiệu tính theo thứ tự từ lần tạo nhóm đầu tiên. 140 Các phương pháp nén không mất thông tin Ví dụ: Cho thông điệp “BBCAACADBDCADAEEEABAC DBACADCBADABEABEAAA” Tần suất xuất hiện của các ký tự trong thông điệp lần lượt bằng: A: 15; B: 8; C: 6; D: 6; E: 5. A: 00; B: 01; C: 10; D: 110; E: 111. Số lượng bit dùng để chứa chuỗi mã: 2x15+2x8+2x6+3x6+3x5=91bit. Nếu dùng mã ASCII: 40x8=320bit. Tỷ lệ nén: 91/320 = 28% Mã Fano là mã có tính prefix. 141 Các phương pháp nén không mất thông tin Phương pháp Huffman. Nguyên lý: tương tự mã Shannon-Fano. Thuật toán: Xây dựng danh sách các ký tự với xác suất xuất hiện giảm dần. Các ký tự sẽ là các nút của cây Huffman. Mã hoá bắt đầu với hai ký hiệu có xác suất nhỏ nhất. Hai ký hiệu được hợp lại, hai nhánh được gán ký hiệu 0 hoặc 1. Nút của hai nhánh được coi là một ký hiệu mới có xác suất xuất hiện bằng tổng hai xác suất xuất hiện của hai ký hiệu tạo ra nút. Tiếp tục quá trình trên với hai nút có xác suất xuất hiện nhỏ nhất. Từ mã ứng với mỗi ký hiệu nguồn là tổ hợp của các ký hiệu mã ở các nhánh tính từ gốc. Các ưu điểm: Cho phép thực hiện tốt với hình ảnh cũng như text. Tỷ lệ nén trung bình: 50%. Tốc độ nén nhanh. 142 Các phương pháp nén không mất thông tin Ví dụ: với cùng thông điệp trước: “BCAACADBDCADAEEEABACDBACADCBADABEABEAAA” A: 17; B: 7; C: 6; D: 6; E: 5. A: 0; B:100; C: 101; D: 110; E: 111 Mã Huffman có tính prefix. Số lượng bit dùng để chứa chuỗi mã: 1x17+3x7+3x6+3x6+3x5=87 Tỷ lệ nén: 87/320=27% 143 Các phương pháp nén không mất thông tin Phương pháp thay thế RLE(Run Length Encoding). Nguyên lý: Tối ưu hoá mã bằng cách thay thế các chuỗi ký tự giống nhau liên tiếp. ứng dụng trong các loại ảnh BMP, TIFF. Các điểm ảnh liên tiếp có giá trị như nhau sẽ được thay thế bằng một điểm ảnh và chỉ rõ số lượng điểm. Các bước thuật toán: Tìm trong thông điệp những ký tự liên tiếp lặp lại. Thay thế chuỗi ký tự đó bằng: Một ký tự đặc biệt chỉ việc nén. Số lần lặp lại của ký tự. Ký tự lặp lại được nén. Ví dụ: Cho chuỗi “ABCCCCCCDDEEEE” Chọn ký tự nén: # Chuỗi sau khi nén: AB#6CDD#4E Tỷ lệ nén: 57% 144 Các phương pháp nén không mất thông tin Phương pháp LWZ Nguyên lý: Phân tích thông điệp. Lần lượt lập bảng chứa vị trí xuất hiện của các từ tìm thấy trong thông điệp. Giảm số lượng bit để mã hoá những từ xuất hiện thường xuyên. Tăng số lượng bit để mã hoá những từ ít gặp hơn. đặc tính: ít hiệu quả đối với ảnh. Có hiệu quả cao với text hoặc dữ liệu số. Lỷ lệ nén có thể đạt tới 50%. Các bước thuật toán: Thông điệp được phân chia thành những khối có độ dài thay đổi. Các khối này gọi là các câu. Một câu mới là một khối của ký tự nguồn và thêm một ký tự cuối. Các câu được liệt kê trong từ điển kèm theo vị trí xuất hiện. Để mã hoá một câu mới ta chỉ vị trí của câu trong từ điển và chèn thêm ký hiệu mới vào cuối. 145 Các phương pháp nén không mất thông tin Ví dụ: Chuỗi ký tự: PQPQPQRPQRPQRPQRPQR Từ điển: 256 PQ 257 QR 258 PQP 259 PQR 260 PQRPQR Kết quả mã hoá: 256 256 260 260 259 Tỷ lệ nén: 2 x 5 / 1 x 19 = 53% Để giải mã ta cũng phải lập có từ điển và tra cứu ngược lại trong từ điển 146 Các phương pháp nén mất thông tin Nhận xét về các phương pháp nén không mất thông tin: Tỷ lệ nén trung bình của các phương pháp nén không mất thông tin khoảng 40%. Các phương pháp này không thích hợp với thông tin Multimedia. Nguyên lý nén mất thông tin. Dựa vào khả năng cảm nhận của thị giác và thính giác. Giữ những thông tin quan trọng trong cảm nhận bằng thị giác và thính giác. Loại bỏ những thông tin dư thừa đối với cảm nhận. Nén âm thanh. Dựa vào khả năng cảm nhận âm thanh của thính giác: Từ 20Hz đến 20KHz. Cảm nhận cực đại trong khoảng: từ 2 KHz – 5KHz Các phương pháp DPCM, ADPCM, LPC. 147 Nén âm thanh Một số phương pháp nén âm thanh PCM (Pulse-Code Modulation) DPCM (differential pulse-code modulation) ADPCM (Adaptive Differential PCM) PASC (Perceptual Audio Sub-band Coding) LPC (Linear predictive coding) 148 Các phương pháp nén mất thông tin Phương pháp PCM PCM(Pulse Code Modulation). Biểu diễn các tín hiệu số bằng chuỗi các xung. Dùng để mã hóa tương tự - số Tuân theo định lý Nyquist-Shannon 149 Nén âm thanh Phương pháp DPCM Giảm tỷ lệ dữ liệu của PCM bằng cách mã hoá sự khác biệt giữa giá trị các mẫu. Mã hoá dự đoán: dự đoán mẫu thứ n+1 theo tổ hợp tuyến tính của n mẫu tín hiệu trước đó. ai là n hệ số dự đoán 1 0 )()(~ n i i isans 150 Nén âm thanh 151 Nén âm thanh Phương pháp DM (Delta Modulation) : Là trường hợp riêng của phương pháp DPCM Mã hóa sai khác chỉ dùng 1 bit Mã hóa 0 hoặc 1 tùy thuộc vào cường độ tín hiệu xung hiện tại so với xung trước đó Ưu nhược điểm Đơn giản Mã hóa ít bit Độ chính xác không cao, sai số lớn Tỉ lệ SNR thấp Phương pháp tăng cường hiệu năng Tăng tần số mã hóa 152 Phương pháp DM (tiếp) 153 Nén âm thanh ADPCM(Adaptive Differential PCM): Phương pháp DPCM có hạn chế là : bộ dự đoán và lượng tử hóa là cố định hiệu năng thay đổi tùy vào dữ liệu đầu vào ADPCM sử dụng các bộ dự đoán và lượng tử hóa thích nghi dựa vào các dữ liệu đã nhận được trước đó tối thiểu hóa sự sai khác giữa mẫu dự đoán và mẫu thực tế Bộ dự đoán thích nghi : thay đổi tham số tùy thuộc đầu vào trước đó Lượng tử thích nghi : thay đổi các bước lượng tử hóa khác nhau ADPCM sử dụng trong các thiết bị CD-i và DVI. Chuẩn ADPCM: CCITT G.721. Tỷ lệ nén: 4:1 đến 2:1 154 Nén âm thanh 155 Nén âm thanh Phương pháp PASC (Perceptual Audio Sub-band Coding) Là phương pháp dựa trên SBD (Sub-band Coding) : chia một tín hiệu thành nhiều dải tần con mã hóa mỗi dải tần riêng biệt Mã hóa dự vào cảm nhận âm thanh của con người Cảm nhận từ 20Hz – 20kHz Nhưng cảm nhận âm thanh không đồng đều ở các tần số khác nhau Hiệu ứng che tần số : âm thanh tần số mạnh che âm thanh tần số yếu Được sử dụng trong mã hóa âm thanh chuẩn MPEG 1,2,4 MP3 : MPEG-1 or MPEG-2 Audio Layer III Mã hóa dùng 32 băng tần con, mã hóa cảm nhận và Entropy 156 Nén âm thanh 157 Nén âm thanh Phương pháp LPC (Linear Predictive Coding) Mã hóa tiếng nói dựa vào các tham số tổng hợp giọng nói Dựa vào cấu tạo hình thành âm thanh con người Dây thanh quản Vòng họng Miệng+mũi Phân tích và tổng hợp lại các âm con người phát ra Ứng dụng : Phân tích và tái tạo tiếng nói Sử dụng trong việc truyền âm thanh số, mã hóa trong điều kiện tốc độ thấp Sử dụng kết hợp với các kỹ thuật khác 158 159 Nén mất Thông tin: nén ảnh và video Ảnh được khôi phục không giống hoàn toàn với ảnh gốc Thích hợp cho việc lưu trữ và truyền ảnh tĩnh, video qua một mạng có băng thông hạn chế Differential Encoding, Discrete Cosine Transform(DCT), Vector Quantization, JPEG (Joint Photographic Experts Group) và MPEG (Motion Picture Experts Group) 160 Nén ảnh Các phương pháp nén ảnh có mất tín hiệu gồm có 4 bước như hình . Sơ đồ cơ bản của bộ mã hoá Các bộ mã hoá khối có thể dựa trên hai nguyên tắc biến đổi cơ bản: Discrete Cosine Transform (DCT) và Vector Quantization (VQ) 161 Nén ảnh 162 Nén ảnh Phương pháp nén ảnh JPG: Nguyên lý: 4 bước thực hiện Biến đổi hệ toạ độ màu. Thay đổi các bước lấy mẫu: các điểm được nhóm theo các thông tin về màu thành các nhóm 2 điểm hoặc 4 điểm. Thực hiện phép biến đổi từ miền không gian về miền tần số không gian. Lượng tử hóa không đều các hệ số biến đổi Sử dụng các thuật toán nén RLE và Huffman. 163 Biến đổi hệ màu RGB YCbCr Do mắt người nhạy với thành phần Y hơn so với Cb, Cr nên giảm số bit lưu trữ Cb, Cr 164 Nén ảnh 165 Nén ảnh Ta có thể xác định 64 giá trị chỉ bằng 5 số ngyên nếu ta ap dụng công thức discrete cosine transform (DCT) Bộ giải mã có thể tái tạo lại giá trị của các pixel thông qua công thức inverse discrete cosine transform (IDCT) c 166 Nén ảnh 167 Nén ảnh – ví dụ DCT Tru 128 168 Nén ảnh – ví dụ 169 170 171 Nén ảnh Chuẩn JPEG 2000 JPEG đã đưa ra một chuẩn nén ảnh mới là JPEG2000. JPEG2000 sử dụng biến đổi Wavelet và các phương pháp mã hoá đặc biệt để có được ảnh nén ưu việt hơn hẳn JPEG. JPEG2000 có nhiều chức năng đặc biệt hơn các chuẩn nén ảnh tĩnh khác như JPEG hay GIF. Dưới đây là các chức năng ưu việt của JPEG2000 so với các chuẩn nén ảnh tĩnh khác Cho chất lượng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất. Sử dụng được với truyền dẫn và hiển thị luỹ tiến về chất lượng, độ phân giải, các thành phần màu và có tính định vị không gian. Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén. Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ liệu. Giải nén từng vùng trong ảnh mà không cần giải nén toàn bộ ảnh Có khả năng mã hoá ảnh với tỷ lệ nén theo từng vùng khác nhau Nén một lần nhưng có thể giải nén với nhiều cấp chất lượng tuỳ theo yêu cầu của người sử dụng 172 Nén ảnh 173 Nén ảnh 174 Nén ảnh 175 Nén ảnh So sánh chuẩn JPEG và JPEG2000 với tỉ lệ 0.25 bpp, CR = 32 176 Nén video Đối với tín hiệu video số, số lượng bit được sử dụng để truyền tải thông tin đối với mỗi miền tần số khác nhau, có nghĩa là: miền tần số thấp, nơi chứa đựng nhiều thông tin, được sử dụng số lượng bít lớn hơn và miền tần số cao, nơi chứa đựng ít thông tin, được sử dụng số lượng bít ít hơn. Thực chất của kỹ thuật “nén video số” là loại bỏ đi các thông tin dư thừa. Các thông tin dư thừa trong nén video số thường là: Độ dư thừa không gian giữa các pixel; Độ dư thừa thời gian do các ảnh liên tiếp nhau; Độ dư thừa do các thành phần màu biểu diễn từng pixel có độ tương quan cao; Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác suất xuất hiện không đều nhau; Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm nhận của mắt).vv 177 Nén video MJPEG (Motion JPEG) – là việc sử dụng chuẩn mã hóa video sử dụng các frame được mã hóa bằng chuẩn nén ảnh JPEG Đơn giản – các frame độc lập với nhau Giới hạn mã hóa 1:20 MJPEG được phát triển cho các máy tính cá nhân, hiện nay dùng các thiết bị khác. Hiện nay MJPEG được ứng dụng cho Máy quay số Thu nhận và chỉnh sửa video IP Camera Sử dụng cho các thiết bị hiển thị video 178 Nén video MPEG (Moving Picture Expert Group) là nhóm chuyên gia về hình ảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây dựng tiêu chuẩn cho tín hiệu Audio và Video số. Ngày nay, MPEG đã trở thành một kỹ thuật nén Audio và Video phổ biến nhất MPEG-1, mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s và lưu trữ trong đĩa CD. MPEG-2 (1990) : MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát triển. (3-15Mbps) MPEG-4 (10/1998), Là chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ hoạ và video tương tác hai chiều (games, videoconferencing) và các ứng dụng multimedia tương tác hai chiều (World Wide Web, Internet video...) MPEG-7: là một chuẩn dùng để mô tả các nội dung Multimedia, chứ không phải là một chuẩn cho nén và mã hoá audio/ảnh động như MPEG-1, MPEG-2 hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộng XML(Extansible Markup Language) để lưu trữ các siêu dữ liệu Metadata, đính kèm timecode để gắn thẻ cho các sự kiện, hay đồng bộ các dữ liệu. 179 180 Nén video Các cấu trúc lấymẫu vỡ số hoá tín hiệu video Đối với truyền hình số NTSC vỡ PAL, chuỗi video gồm các khung hình (frame ảnh) có độ phân giải 576 x 720, các dòng video chứa 720 điểm ảnh đ−ợc lấy mẫu vỡ số hoá theo các cấu trúc sau : 181 Nén video 182 Nén video 183 Nén video Các chuẩn nén video hầu hết đều sử dụng 2 kỹ thuật chính là : Nén video không dùng kỹ thuật phát hiện và bù chuyển động - MJPEG Nén video dùng kỹ thuật phát hiện và bù chuyển động Nén ảnh tĩnh để giảm độ dư thừa không gian Đánh giá, ước lượng chuyển động để giảm độ dư thừa về mặt thời gian 184 Nén video Phân loại các frame video Frame I : là frame đầu tiên trong chuỗi video Frame P : (predicted frame) – frame được dự đoán tiếp theo Frame B (Bi-directional interpolated prediction frame) - frame được dự đoán nội suy 2 chiều 185 Nén video Cấu trúc dòng bit MPEG 186 187 Cấu trúc dòng bit MPEG 188 Nén video Mô hình mã hóa MPEG 189 Nén video Đánh giá chuyển động (Motion Estimation) : xác định vector chuyển động Bù chuyển động (Motion Compensation) : khôi phục ảnh bằng cách sử dụng vector chuyển động và sai số chuyển động (phần sai lệch giữa 2 frame) 190 Nén video Quá trình nén frame I 191 Nén video Quá trình nén frame P Frame B ? 192 Giải thuật đối sánh, xác định vector chuyển động
File đính kèm:
- multimedia_cac_ky_thuat_trong_da_phuong_tien.pdf