Multimedia - Các kỹ thuật trong đa phương tiện

Các kỹ thuật trong đa phương tiện

 Các kỹ thuật điều khiển

 Các kỹ thuật thu nhận

 Các kỹ thuật lưu trữ

 Các kỹ thuật xử lý

 Các kỹ thuật hiển thị

 Các kỹ thuật truyền dữ liệu

pdf 109 trang dienloan 7160
Bạn đang xem 20 trang mẫu của tài liệu "Multimedia - Các kỹ thuật trong đa phương tiện", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Multimedia - Các kỹ thuật trong đa phương tiện

Multimedia - Các kỹ thuật trong đa phương tiện
84
3. Các kỹ thuật trong đa phương tiện
 Các kỹ thuật điều khiển
 Các kỹ thuật thu nhận
 Các kỹ thuật lưu trữ
 Các kỹ thuật xử lý
 Các kỹ thuật hiển thị
 Các kỹ thuật truyền dữ liệu
85
Quá trình xử lý thông tin Multimedia
 Quá trình Multimedia thực hiện thao tác trên các đổi
tượng Multimedia:
 Văn bản, các số
 Âm thanh: tiếng ồn, tiếng nói, âm nhạc
 Hình ảnh tính: đồ họa, ảnh tĩnh
 Hình ảnh động: video, animation
 Quá trình xử lý thông tin Multimedia
 Thu nhận thông tin: thông qua các thiết bị đầu vào
 Xử lý thông tin: thông qua bộ xử lý
 Lưu trữ thông tin: các thiết bị lưu trữ
 Hiển thị thông tin: các thiết bị ra
 Trao đổi thông tin: các thiết bị truyền thông
86
3.1 Các kỹ thuật điều khiển
 Bàn phím
 Thiết bị ngoại vi được mô hình một phần theo bàn phím máy đánh
chữ. Về hình dáng, bàn phím là sự sắp đặt các nút hay phím.
 Các ký tự được khắc lên bàn phím
 Mỗi một phím tương ứng với một ký hiệu, tuy nhiên có thể kết hợp nhiều
phím lại với nhau.
 Bàn phím được sử dụng để tạo ra ký tự, nhưng trong nhiều trường hợp có
thể đưa ra lệnh thực thi.
 Bàn phím chuẩn: 101-key US hay 104-key Windows gồm các chữ, số
và một vài biểu tượng đặc biệt.
 Gaming and Multimedia: Bàn phím có một số nút mở rộng phục vụ
cho mục đích nghe nhạc, lướt web v.v
87
3.1 Các kỹ thuật điều khiển
 Bàn phím
 Menbrane keyboard
 Hoạt động dựa trên tiếp xúc của lớp bề mặt với mạch điện phía dưới.
 Sử dụng từ những năm 1980 trong các máy tính gia đình như Z80, Z81, 
Atari 400.
 Giá thành tốt, có khả năng chống bụi và chất lỏng, tuy nhiên khả năng
tạo cảm giác kém gây khó khăn cho người dùng.
 Thích hợp các thiết bị nút như remote điều khiển từ xa, lò vi sóng hay 
điện thoại di động.
88
3.1 Các kỹ thuật điều khiển
 Bàn phím
 Dome-switch keyboard
 Kết hợp bàn phím menbrane và bàn phím cơ học. Gốm hai bản mạch
nằm bên dưới một nút tròn cao sư có bọc trì. Khi phím được ấn, mạch sẽ
đòng và truyền tín hiệu đi.
 Được sử dụng trong nhiều thiết bị điều khiển cầm tay như video game 
console
 Scissor-switch keyboard
 Là trường hợp đặc biệt của dome-switch.
 Phím được đưa vào giữa hai miếng nhựa giống như một cái kéo.
 Có các nút hình cao su ngắn so với trường hợp dome-switch, khoảng
cách di chuyển của các phím chỉ vào 2 mm.
 Được sử dụng làm bàn phím laptop.
89
3.1 Các kỹ thuật điều khiển
 Bàn phím
 Roll-up keyboad
 Bàn phím nhựa deo có thể cuộn lại. Vật liệu sử dụng có thể là silicon
chỉ đứt khi chịu tác dụng lực mạnh.
 Được bọc lớp vỏ cao sư khiến nó có khả năng chống nước giống như
membrane. Nó ít tạo cảm giác cho người dùng.
 Bàn phím thông thường
 Không chỉ có các bộ chuyển mạch giống nhu dome-switch mà còn có bộ
vi xử lý thường là chip 8048 cho phép bàn phím có thể cung cấp nhiều
tính năng đặc biệt. Nó xử lý các tín hiệu đến và các đèn caps lock, num 
lock, scroll lock.
 Vấn đề: 
 Nhấn một phím có thể tạo cảm giác đóng mạch nhiều lần.
 3 phím ấn cùng một lúc
 Kết nối qua cổng PS/2 hoặc USB
90
3.1 Các kỹ thuật điều khiển
 Chuột
 Chuột bi
 Bill English phát minh năm 1972.
 Cấu tạo gồm 1 viên bi cao su và hai con lăn ở hai bên xác định vị trí lên
xuống, sang trái phải.
 Chuyển động biến thành tín hiệu và truyền tới máy tính thông qua dây
dẫn và chuyển thành tọa độ x, y trên màn hình hiển thị.
 Chuột quang
 Sử dung diot và photo diot để xác định chuyển động tương đối trên mặt
phẳng. 
 Chuột quang hiện đại có bộ cảm biến cho phép ghi nhận hình ảnh bề
mặt chuyển động, kèm theo một chip có khả năng xử lý ảnh để xác định
vị trí chuyển động.
91
3.1 Các kỹ thuật điều khiển
 Chuột
 Chuột kết nối qua cổng PS/2 gồm 6 chân mini-DIM, ở chế độ bình
thường chuột PS/2 sẽ truyền tín hiệu truyền động và trạng thái của
các nút bấm bằng một gói tin 3 bytes, có dạng như sau
92
3.1 Các kỹ thuật điều khiển
93
3.1 Các kỹ thuật điều khiển
 Bút quang học
 Hỗ trợ vẽ trên máy tính và có khả năng hoạt động như chuột, nhưng
có yêu cầu đặc biệt về bàn để.
 Kết nối với máy tính thông qua cổng USB.
 Nhược điểm: khó sử dụng và giá thành tương đối cao.
 Touchscreen
 Có tác dụng tương tác trực tiếp với vật hiển thị.
 Được thiết kế chủ yếu cho các thiết bị PDA, mobile phone hoặc video 
game.
 Đặc tính của nó là có thể nhận được tay người ấn lên và chuyển
thành lệnh thực thi.
 Phân loại:
 Resistive touchscreen
 Surface acoustic wave
 Capacitive
94
3.1 Các kỹ thuật điều khiển
 Joystick 
 Joystick là thiết bị ngoại vi cho phép điều khiển cả hướng và góc, 
được sử dụng chủ yếu trong trò chơi điện tử và có một hoặc nhiều
nút ấn.
 Thay đổi vị trí trái – phải: dịch theo trục X.
 Thay đổi vị trí trước – sau: dịch theo trục Y.
 Quay vòng theo hoặc ngược chiều kim đồng hồ: dịch theo trục Z.
 Một số loại Joystick có khả năng force feedback, cho phép máy tính
có thể trả tín hiệu ngược lại gây ra rung động trên joystick.
 Joystick được kết nối với máy tính thông qua cổng USB.
 Hat switch: để điều khiển một số loại joystick, trong nhiều trường hợp
nó cho phép nhìn xung quang khi người chơi tham gia vào thế giới ảo
như trong các chương trình mô phỏng lái máy bay
95
3.2 Các kỹ thuật thu nhận
 Máy scanner
 Máy quét scanner là thiết bị cho phép chụp ảnh quang học các văn
bản, chữ viết tay hay ảnh và chuyển nó sang dạng ảnh số, lưu trữ
trong máy tính.
 Sử dụng công nghệ: 
 CCD (Charge-coupled device) 
 CIS (Contact Image Sensor)
96
3.2 Các kỹ thuật thu nhận
 Máy scanner
 CCD
 Shift register tương tự cho phép truyền tín hiệu tương tự và được điểu khiển bởi
xung đồng hồ. Ngày nay nó thường được sử dụng làm bộ cảm biến ánh sáng
quang điện.
 Về nguyên tắc hoạt động CCD có thể chia ra làm hai miền: miền quang hoạt và
miền truyền.
 CCD được sử dụng trong máy ảnh kỹ thuật số, camera, scanner quang như các
thiết bị cảm biến ánh sáng. 
 CCD tương đối nhạy với tia hồng ngoại, gây ra hiện tượng mắt đỏ trên ảnh.
 CIS
 Được sử dụng trong các máy desktop scanner, CIS sử dụng hệ thống đèn LED đỏ, 
lục, lam để chiếu sáng.
 CIS thường sử dụng ít năng lượng hơn cho nên có thể áp dụng cho một số scanner 
có nguồn cung điện thế thấp.
 CIS cho chất lượng ảnh kém hơn, nhưng lại cho cấu trúc tương đối nhỏ gọn, tất cả
các thành phần cần thiết đều có thể tích hợp trong một môđun duy nhất.
 CIS được sử dụng trong đọc mã vạch và một số các thiết bị nhận dạng.
97
3.2 Các kỹ thuật thu nhận
 Máy ảnh số
 Máy ảnh số thường gọi là máy ảnh kỹ thuật số là một thiết bị điện tử
dùng để thư và lưu giữ hình ảnh một cách tự động thay vì dùng phim
ảnh giống như máy chụp ảnh thường.
 Phân loại
 Máy chụp ảnh số xem ngay
 Máy chụp ảnh số gọn
 Máy chụp ảnh số chuyên nghiệp dạng rời
 Độ phân giải ảnh
 Độ phân giải của máy chụp ảnh số thường được quyết định bởi bộ cảm
biến, đó là phần đổi ánh sáng thành những tín hiệu rời rạc.
 Một thuộc tính quan trọng của máy chụp ảnh số là số pixel của nó, tính
theo hàng triệu gọi là megapixel.
 Tỉ lệ kích thước ảnh có thể là 4:3 hoặc 3:2.
98
3.2 Các kỹ thuật thu nhận
 Máy ảnh số
 Độ phân giải ảnh
99
3.2 Các kỹ thuật thu nhận
 Máy ảnh số
 Các phương pháp thu ảnh
 Phương pháp chụp một lần
 Phương pháp thứ hai gọi là chụp nhiều lần
 Phương pháp thứ ba là quét ảnh giống như desktop scanner 
 Lưới lọc màu, nội suy, chống răng cưa
100
3.2 Các kỹ thuật thu nhận
 Camera số và Webcam
 Camera số: 
 Nhận trực tiếp thông tin video số
 Lưu trữ thông tin video dạng số
 Ưu điểm của video số:
 Dễ dàng đưa vào máy tính và xử lý
 Nén video là nén mất mát thông tin
 Không sử dụng băng từ, do đó làm thu nhỏ thiết bị
 Nhìn trực quan video thu được
 Không giảm chất lượng khi sao chép
 Nhược điểm
 Độ phân giải thấp
 Giá bộ nhớ cao
 Webcam
 Camera số có chất lượng thấp
 Gắn trực tiếp vào máy tính
 Cho phép tương tác trực tiếp với Internet
 Độ phận giải thấp – 640 x 480 300.000 pixel
101
3.3 Các kỹ thuật lưu trữ
 Đĩa CD
 Đĩa CD là một trong những loại đĩa quang học, chúng thường được
chế tạo bằng chất dẻo có đường kính là 4,75 inch, dùng phương
pháp ghi quang học để lưu trữ khoảng 80 phút âm thanh hoặc 700 
MB dữ liệu máy tính đã được mã hóa theo kỹ thuật số.
 Đặc điểm
 Tốc độ quét: 1.2 – 1.4 m/s
 Độ dài rãnh: 1.6 µm
 Đường kính đĩa: 120 mm
 Độ dày: 1.2 mm
 Bán kính trong của vùng lưu trữ: 25 mm
 Bán kính ngoài của vùng lưu trữ: 58 mm
 Đường kính lỗ trục: 15 mm 
102
3.3 Các kỹ thuật lưu trữ
 Đĩa CD
 Cấu tạo của đĩa CD gồm có 3 lớp:
 Một lớp nhựa
 Một lớp bảo vệ bề mặt
 Một lớp màng kim loại phản xạ
 Các vết dữ liệu được khắc lên lớp màng kim loại theo các lỗ có độ sâu
0.83µm, độ cách quãng: 1.6µm.
 Các vết khắc thể hiện các mã nhị phân: vùng bằng tương ứng bit 0, sự biến
đổi từ vùng cao sang vùng thấp hoặc từ vùng thấp sang vùng cao tương ứng
bit 1.
103
3.3 Các kỹ thuật lưu trữ
 Đĩa CD
 Cấu trúc dữ liệu
 Đơn vị lưu trữ nhỏ nhất trong CD là frame gồm 33 byte:
 6 mẫu 16 bit stereo (2 byte x 2 kênh x 6 mẫu = 24 byte).
 8 byte sửa lỗi CIRC (Cross-interleaved Reed-Solomon coding)
 1 byte lưu thông tin điều khiển và hiển thị
 Mỗi byte được chuyển thành 14 bit theo phương pháp điều chế eight-to-
fourteen. + 3 bit bổ trợ tạo thành 17 bit. Như vậy tổng cộng có 33 x 
(14+3) = 561 bit + 27 bit đồng bộ = 588 bit cho một frame.
 Các frame được nhóm lại tạo thành sector: Mỗi sector có 98 frame tương
đương 2352 (98x24) byte âm nhạc. Đầu đọc CD có khả năng quét 75 
sector/s ~ 176.400 byte/s. Chia cho hai kênh và hai byte cho một mẫu
chúng ta có tốc độ là 44,100 mẫu/s. 
104
3.3 Các kỹ thuật lưu trữ
 Đĩa CD
 Điều chế eight-to-fourteen
 Không có hai bit 1 nằm kề nhau, tối
thiểu phải cách 2 bit 0 để tránh bước
chuyển và làm giảm tốc độ đọc.
 Như vậy thời gian tối thiểu để xảy ra
bước chuyển là 3T (T = 231.4 ns)
 Thời gian tối đa xảy ra bước chuyển
là 11 T (chuỗi 14 bit có hơn 10 bit 0 
nằm giữa hai bit 1). 
105
3.3 Các kỹ thuật lưu trữ
 Đĩa CD
 Các chuẩn CD
 ISO 9660.
 Dùng lưu trữ thông tin Multimedia.
 Music Disc
 SACD (Super Audio CD)
 CD-Text 
 CD-I (Compact Disc interative)
 CD-ROM XA
 CD-I Bridge
 CD-R
 Video CD (VCD)
 Mini CD
106
3.3 Các kỹ thuật lưu trữ
 Đĩa CD
 CD-DA
 Được giới thiệu lần đầu tiên vào những năm 1980 bởi Sony và Philips 
 Lưu trữ âm thanh số: 44.1 KHz và 16 bit.
 Một sector (block) chứa 98 dải 24 octect tương được bới 2.352 octet 
(1/75 giây âm nhạc): là đơn vị nhỏ nhất trên đĩa CD-DA.
 CD-DA: 747 MB, 1-99 rãnh, mỗi rãnh chứa 300 sector.
 Tốc độ dữ liệu: 44.1 KHz tần số lấy mẫu, 16 bit mã hóa, 2 kênh
 44100 x 16 x 2 = 1411200 bit/s
 Dung lượng: 1411200 x 60 x 70 = 747 MB
 Kiểm soát lỗi bằng CICR và EFM
107
3.3 Các kỹ thuật lưu trữ
 Đĩa CD
 CD-ROM
 Dược giới thiệu lần đầu tiên vào năm 1983 bởi Sony và Philips 
 Mỗi khối thông tin chứa 98 khung dữ liệu, mỗi khung dài 24 octet, cho ta
2.352 octet dữ liệu
 Có hai chế độ: chứa dữ liệu tin học và âm thanh
 Trong chế độ thứ nhất: các dữ được tăng thêm tính sửa lỗi và phát hiện
lỗi: tỉ lệ bit lỗi: 10-15. Khuôn dạng dữ liệu có: 12 byte Sync, 4 byte 
Hearder, 8 byte dự phòng, 2048 byte dữ liệu, 276 byte sửa lỗi và 4 byte 
phát hiện lỗi.
 Trong chế độ thứ 2: toàn bộ 2336 byte dữ liệu, 16 byte đầu giống chế độ
thứ nhất.
 Tốc độ đọc khối: 75 khối/s; data rate: chế độ thứ nhất: 150 KBps, chế độ
thứ hai: 171 KBps.
 Dung lượng
 Chế độ thứ nhất: 74 x 60 x 75 x 2048 = 650 MB.
 Chế độ thứ hai: 74 x 60 x 75 x 2336 = 742 MB.
108
3.3 Các kỹ thuật lưu trữ
 DVD
 Còn gọi là Digital Versatile Disc hoặc Digital Video Disc được phát 
minh vào năm 1995. Nó dùng để lưu dữ liệu và video. DVD có cùng 
kích thước với CD nhưng dung lượng của nó gấp 6 lần.
 Phân loại
 DVD-5: có một mặt và một lớp lưu thông tin, khả năng lưu trữ 4.7 GB.
 DVD-9: có một mặt và hai lớp lưu thông tin, khả năng lưu trữ là 8.5 GB.
 DVD-10: có hai mặt và mỗi mặt có một lớp lưu thông tin, khả năng lưu trữ
9.4 GB.
 DVD-9: có hai mặt và mỗi mặt có hai lớp lưu thông tin, khả năng lưu trữ
là 17 GB.
 Blu-ray
 Blu-ray sử dụng ánh sáng laser xanh với bước sóng 405 nm để đọc và
viết dữ liệu
 Hard-coating
109
3.3 Các kỹ thuật lưu trữ
 Hard disk driver
 HDD là thiết bị lưu trữ dữ liệu trên bề mặt các tấm đĩa hình tròn phủ
vật liệu từ tính, thuộc dạng bộ nhớ “không thể xâm phạm”, có nghĩa 
là chúng không bị mất dữ liệu khi ngừng cung cấp nguồn điện.
 Cấu tạo
110
3.3 Các kỹ thuật lưu trữ
 Hard disk driver
 Hoạt động
 Head: Đầu đọc/ghi di chuyển trên bề mặt đĩa
 Grain: Các thành phần hạt từ và phương của chúng sắp xếp đồng hướng
trong một khoảng.
 R, N: vị trí từ ngược/thuận (theo quy ước)
 Magnetic Field lines: Đường sức từ (khi không có đầu đọc/ghi)
 Binary value encoded: Giá trị tín hiệu nhị phân (0101) nhận được
111
3.3 Các kỹ thuật lưu trữ
 Hard disk driver
 Một số thông số của ổ đĩa
 Dung lượng và tốc độ
 Thời gian tìm kiếm trung bình: là khoảng thời giant rung bình (đơn vi ms) 
mà đầu đọc có thể di chuyển từ một cylinder này đến cylinder khác ngẫu
nhiên.
 Thời gian truy cập ngẫu nhiên: là thời giant rung binh để đĩa cứng tìm
kiếm một dữ liệu ngẫu nhiên, tính băng ms (số liệu năm 2007 là từ 5-15 
ms).
 Thời gian làm việc tin cậy: MTBF (Mean time between failures) có thể
hiểu là tuổi thọ của ổ đĩa cứng tính theo đơn vị giờ.
 Bộ nhớ đệm: giống như RAM trong máy tính, đầu đọc ghi đọc dữ liệu và
lưu vào trong bộ nhớ tạm.
112
3.3 Các kỹ thuật lưu trữ
 Hard disk driver
 Chuẩn giao tiếp vật lý
 SCSI (Small Computer System Interface)
 ATA (Advanced Technology Attactment) tốc độ truyền dữ liệu tối đa là
133 MB/s
 SATA (Serial ATA) tốc độ truyền theo chuyền 150 MB/s, tuy nhiên ATA II 
cho phép tốc tộ lên đến 150 MB/s còn ATA III, tốc độ có thể đạt được là
600 MB/s.
113
3.4 Các kỹ thuật xử lý
 CPU – Central Processing Unit
 Intel 4004 ra đời vào năm 1970, nâng cấp lên thành Intel 8080 và
ứng dụng trong máy tính cá nhân và mainframe.
 Định luật Moore: số lượng transistor trên một bo mạch tăng lên gấp
đôi cứ sau 1 năm.
 Máy tính đời mới như máy tính lượng tử, máy tính được tăng cường
khả năng tính toán song song.
 Cấu tạo:
 Bộ điều khiển: điều khiển hoạt động xử lý, được điều tiết chính xác bởi
xung nhịp đồng hồ.
 Thanh ghi: phần tử nhớ tạm trong bộ vi xử lý
 Bộ số học – logic: thực hiện các phép toán logic và số học
114
3.4 Các kỹ thuật xử lý
 CPU – Hoạt động
 Nhận lệnh
 CPU đưa địa chỉ của lệnh cần nhận từ bộ đếm chương trình PC ra bus 
địa chỉ.
 CPU phát tín hiệu điều khiển đọc bộ nhớ
 Lệnh từ bộ nhớ được đặt lên bus dữ liệu và được CPU copy vào thanh
ghi lệnh IR
 CPU tăng nội dung PC để trỏ sang lệnh kế tiếp
115
3.4 Các kỹ thuật xử lý
 CPU – Hoạt động
 Giải mã lệnh
 Lệnh từ thanh ghi lệnh IR được đưa đến đơn vị điều khiển
 Đơn vị điều khiển tiến hành giải mã lệnh để xác định các thao tác phải
thực hiện
 Giải mã lệnh xảy ra bên tro ... ch thước khối thông tin sau khi nén với kích thước
trước khi nén.
 Chất lượng nén:
 Nén mất thông tin.
 Nén không mất thông tin.
 Chất lượng cảm nhận thông tin
 Tốc độ của các thuật toán:
 Tốc độ nén.
 Tốc độ giải nén.
137
Nén không mất thông tin
 Phương pháp nén không mất thông tin cho phép khôi
phục lại hoàn toàn khối dữ liệu ban đầu qua các chu
trình nén – giải nén.
 Đòi hỏi phải có thiết bị lưu trữ và đường truyền lớn
 Các thuật toán của nén không mất dữ liệu dựa vào 
việc thay thế một nhóm các ký tự trùng lặp bởi một 
nhóm các ký tự đặc biệt khác ngắn hơn không quan 
tâm tới ý nghĩa của dữ liệu 
 Run-Length Encoding (RLE), Huffman Coding, 
Arithmetic coding, Shannon-Fano Coding, LZ78, LZH, 
LZW ...
138
Nén không mất thông tin
 Ba dạng thuật toán nén không mất thông tin:
 Các thuật toán mã hoá thống kê:
 Các thuật toán này hoạt động dựa trên tần suất xuất hiện của các ký tự
mã trong khối thông tin. Giảm số lượng bit dùng để biểu diễn các ký tự
mã xuất hiện thường xuyên.
 Tăng số lượng bit dùng để biểu diễn những ký tự mã ít xuất hiện.
 Các thuật toán dựa trên sự thay thế các chuỗi: các thuật toán này
nén các chuỗi chứa các ký tự đồng nhất.
 Các thuật toán dựa trên từ điển:
 Giảm số lượng các bit dùng để chứa các từ xuất hiện thường xuyên.
 Tăng số lượng các bit để chứa các từ xuất hiện thưa thớt.
 Các đặc tính:
 Thuật toán đơn giản.
 Tỷ lệ nén thấp.
 Thích hợp với nén ảnh và văn bản. 
139
Các phương pháp nén không mất thông tin
 Phương pháp nén Shannon-Fano.
 Nguyên lý:
 Các từ mã có độ dài biến thiên.
 Độ dài mã tỷ lệ nghịch với xác suất xuất hiện của ký tự.
 Từ mã được giải mã một cách duy nhất.
 Thuật toán:
 Xác định các xác suất xuất hiện của các ký tự trong bản tin.
 Sắp xếp các ký tự theo trình tự xác suất xuất hiện giảm dần.
 Phân chia các ký tự thành hai nhóm có tổng xác suất xấp xỉ(nếu dùng mã nhị phân
thì phân chia làm hai nhóm, nếu mã cơ số m thì chia làm m nhóm).
 Gán cho mỗi nhóm ký hiệu mã 0 hoặc 1.
 Tiếp tục phân chia cho tới khi trong các nhóm chỉ chứa một ký hiệu.
 Từ mã cho ký hiệu là tổ hợp của các ký hiệu của các nhóm chứa ký hiệu tính theo 
thứ tự từ lần tạo nhóm đầu tiên.
140
Các phương pháp nén không mất thông tin
 Ví dụ:
 Cho thông điệp “BBCAACADBDCADAEEEABAC
DBACADCBADABEABEAAA”
Tần suất xuất hiện của các ký tự trong thông điệp lần lượt bằng:
A: 15; B: 8; C: 6; D: 6; E: 5.
A: 00; B: 01; C: 10; D: 110; E: 111.
Số lượng bit dùng để chứa chuỗi mã:
2x15+2x8+2x6+3x6+3x5=91bit.
Nếu dùng mã ASCII: 40x8=320bit.
Tỷ lệ nén: 91/320 = 28%
Mã Fano là mã có tính prefix.
141
Các phương pháp nén không mất thông tin
 Phương pháp Huffman.
 Nguyên lý: tương tự mã Shannon-Fano.
 Thuật toán:
 Xây dựng danh sách các ký tự với xác suất xuất hiện giảm dần.
 Các ký tự sẽ là các nút của cây Huffman.
 Mã hoá bắt đầu với hai ký hiệu có xác suất nhỏ nhất. Hai ký hiệu được hợp lại, hai
nhánh được gán ký hiệu 0 hoặc 1.
 Nút của hai nhánh được coi là một ký hiệu mới có xác suất xuất hiện bằng tổng hai
xác suất xuất hiện của hai ký hiệu tạo ra nút.
 Tiếp tục quá trình trên với hai nút có xác suất xuất hiện nhỏ nhất.
 Từ mã ứng với mỗi ký hiệu nguồn là tổ hợp của các ký hiệu mã ở các nhánh tính
từ gốc.
 Các ưu điểm:
 Cho phép thực hiện tốt với hình ảnh cũng như text.
 Tỷ lệ nén trung bình: 50%.
 Tốc độ nén nhanh.
142
Các phương pháp nén không mất thông tin
 Ví dụ: với cùng thông điệp trước: 
“BCAACADBDCADAEEEABACDBACADCBADABEABEAAA”
A: 17; B: 7; C: 6; D: 6; E: 5.
A: 0; B:100; C: 101;
D: 110; E: 111
Mã Huffman có tính prefix. 
Số lượng bit dùng để
chứa chuỗi mã: 
1x17+3x7+3x6+3x6+3x5=87
Tỷ lệ nén: 87/320=27%
143
Các phương pháp nén không mất thông tin
 Phương pháp thay thế RLE(Run Length Encoding).
 Nguyên lý:
 Tối ưu hoá mã bằng cách thay thế các chuỗi ký tự giống nhau liên tiếp. 
 ứng dụng trong các loại ảnh BMP, TIFF. Các điểm ảnh liên tiếp có giá trị
như nhau sẽ được thay thế bằng một điểm ảnh và chỉ rõ số lượng điểm.
 Các bước thuật toán:
 Tìm trong thông điệp những ký tự liên tiếp lặp lại.
 Thay thế chuỗi ký tự đó bằng:
 Một ký tự đặc biệt chỉ việc nén.
 Số lần lặp lại của ký tự.
 Ký tự lặp lại được nén.
 Ví dụ:
 Cho chuỗi “ABCCCCCCDDEEEE”
 Chọn ký tự nén: #
 Chuỗi sau khi nén: AB#6CDD#4E
 Tỷ lệ nén: 57%
144
Các phương pháp nén không mất thông tin
 Phương pháp LWZ
 Nguyên lý:
 Phân tích thông điệp.
 Lần lượt lập bảng chứa vị trí xuất hiện của các từ tìm thấy trong thông điệp.
 Giảm số lượng bit để mã hoá những từ xuất hiện thường xuyên.
 Tăng số lượng bit để mã hoá những từ ít gặp hơn.
 đặc tính:
 ít hiệu quả đối với ảnh. 
 Có hiệu quả cao với text hoặc dữ liệu số. Lỷ lệ nén có thể đạt tới 50%.
 Các bước thuật toán:
 Thông điệp được phân chia thành những khối có độ dài thay đổi. Các khối này gọi
là các câu.
 Một câu mới là một khối của ký tự nguồn và thêm một ký tự cuối.
 Các câu được liệt kê trong từ điển kèm theo vị trí xuất hiện.
 Để mã hoá một câu mới ta chỉ vị trí của câu trong từ điển và chèn thêm ký hiệu mới
vào cuối. 
145
Các phương pháp nén không mất thông tin
 Ví dụ:
Chuỗi ký tự: PQPQPQRPQRPQRPQRPQR
Từ điển:
256 PQ
257 QR
258 PQP
259 PQR
260 PQRPQR
Kết quả mã hoá: 256 256 260 260 259
Tỷ lệ nén: 2 x 5 / 1 x 19 = 53%
 Để giải mã ta cũng phải lập có từ điển và tra cứu ngược lại trong từ điển
146
Các phương pháp nén mất thông tin
 Nhận xét về các phương pháp nén không mất thông tin:
 Tỷ lệ nén trung bình của các phương pháp nén không mất thông tin 
khoảng 40%.
 Các phương pháp này không thích hợp với thông tin Multimedia.
 Nguyên lý nén mất thông tin.
 Dựa vào khả năng cảm nhận của thị giác và thính giác.
 Giữ những thông tin quan trọng trong cảm nhận bằng thị giác và thính
giác.
 Loại bỏ những thông tin dư thừa đối với cảm nhận.
 Nén âm thanh.
 Dựa vào khả năng cảm nhận âm thanh của thính giác:
 Từ 20Hz đến 20KHz.
 Cảm nhận cực đại trong khoảng: từ 2 KHz – 5KHz 
 Các phương pháp DPCM, ADPCM, LPC.
147
Nén âm thanh
 Một số phương pháp nén âm thanh
 PCM (Pulse-Code Modulation)
 DPCM (differential pulse-code modulation)
 ADPCM (Adaptive Differential PCM)
 PASC (Perceptual Audio Sub-band Coding)
 LPC (Linear predictive coding) 
148
Các phương pháp nén mất thông tin
 Phương pháp PCM
 PCM(Pulse Code Modulation). Biểu diễn các tín hiệu số bằng chuỗi
các xung.
 Dùng để mã hóa tương tự - số
 Tuân theo định lý Nyquist-Shannon
149
Nén âm thanh
 Phương pháp DPCM
 Giảm tỷ lệ dữ liệu của PCM bằng cách mã hoá sự khác biệt giữa giá
trị các mẫu. 
 Mã hoá dự đoán: dự đoán mẫu thứ n+1 theo tổ hợp tuyến tính của n 
mẫu tín hiệu trước đó.
 ai là n hệ số dự đoán

1
0
)()(~
n
i
i isans
150
Nén âm thanh
151
Nén âm thanh
 Phương pháp DM (Delta Modulation) :
 Là trường hợp riêng của phương pháp DPCM
 Mã hóa sai khác chỉ dùng 1 bit
 Mã hóa 0 hoặc 1 tùy thuộc vào cường độ tín hiệu xung hiện tại so 
với xung trước đó
 Ưu nhược điểm
 Đơn giản
 Mã hóa ít bit
 Độ chính xác không cao, sai số lớn
 Tỉ lệ SNR thấp
 Phương pháp tăng cường hiệu năng
 Tăng tần số mã hóa
152
 Phương pháp DM (tiếp)
153
Nén âm thanh
 ADPCM(Adaptive Differential PCM): 
 Phương pháp DPCM có hạn chế là : bộ dự đoán và lượng tử hóa là
cố định hiệu năng thay đổi tùy vào dữ liệu đầu vào
 ADPCM sử dụng các bộ dự đoán và lượng tử hóa thích nghi dựa
vào các dữ liệu đã nhận được trước đó tối thiểu hóa sự sai khác
giữa mẫu dự đoán và mẫu thực tế
 Bộ dự đoán thích nghi : thay đổi tham số tùy thuộc đầu vào trước đó
 Lượng tử thích nghi : thay đổi các bước lượng tử hóa khác nhau
 ADPCM sử dụng trong các thiết bị CD-i và DVI.
 Chuẩn ADPCM: CCITT G.721.
 Tỷ lệ nén: 4:1 đến 2:1
154
Nén âm thanh
155
Nén âm thanh
 Phương pháp PASC (Perceptual Audio Sub-band 
Coding)
 Là phương pháp dựa trên SBD (Sub-band Coding) : chia một tín hiệu
thành nhiều dải tần con mã hóa mỗi dải tần riêng biệt
 Mã hóa dự vào cảm nhận âm thanh của con người
 Cảm nhận từ 20Hz – 20kHz
 Nhưng cảm nhận âm thanh không đồng đều ở các tần số khác nhau
 Hiệu ứng che tần số : âm thanh tần số mạnh che âm thanh tần số yếu
 Được sử dụng trong mã hóa âm thanh chuẩn MPEG 1,2,4
 MP3 : MPEG-1 or MPEG-2 Audio Layer III
 Mã hóa dùng 32 băng tần con, mã hóa cảm nhận và Entropy
156
Nén âm thanh
157
Nén âm thanh
 Phương pháp LPC (Linear Predictive Coding)
 Mã hóa tiếng nói dựa vào các tham số tổng hợp giọng nói
 Dựa vào cấu tạo hình thành âm thanh con người
 Dây thanh quản
 Vòng họng
 Miệng+mũi
 Phân tích và tổng hợp lại các âm con người phát ra
 Ứng dụng :
 Phân tích và tái tạo tiếng nói
 Sử dụng trong việc truyền âm thanh số, mã hóa trong điều kiện tốc độ
thấp
 Sử dụng kết hợp với các kỹ thuật khác
158
159
Nén mất Thông tin: nén ảnh và video
 Ảnh được khôi phục không giống hoàn toàn với ảnh 
gốc 
 Thích hợp cho việc lưu trữ và truyền ảnh tĩnh, video 
qua một mạng có băng thông hạn chế
 Differential Encoding, Discrete Cosine 
Transform(DCT), Vector Quantization, JPEG (Joint 
Photographic Experts Group) và MPEG (Motion 
Picture Experts Group) 
160
Nén ảnh
 Các phương pháp nén ảnh có mất tín hiệu gồm có 4 
bước như hình .
 Sơ đồ cơ bản của bộ mã hoá
 Các bộ mã hoá khối có thể dựa trên hai nguyên tắc 
biến đổi cơ bản: Discrete Cosine Transform (DCT) và
Vector Quantization (VQ) 
161
Nén ảnh
162
Nén ảnh
 Phương pháp nén ảnh JPG:
 Nguyên lý: 4 bước thực hiện
 Biến đổi hệ toạ độ màu.
 Thay đổi các bước lấy mẫu: các điểm được nhóm theo các thông tin về
màu thành các nhóm 2 điểm hoặc 4 điểm.
 Thực hiện phép biến đổi từ miền không gian về miền tần số không gian.
 Lượng tử hóa không đều các hệ số biến đổi
 Sử dụng các thuật toán nén RLE và Huffman.
163
 Biến đổi hệ màu RGB YCbCr
 Do mắt người nhạy với thành phần Y hơn so với Cb, 
Cr nên giảm số bit lưu trữ Cb, Cr
164
Nén ảnh
165
Nén ảnh
 Ta có thể xác định 64 giá trị chỉ bằng 5 số ngyên nếu ta ap 
dụng công thức discrete cosine transform (DCT)
 Bộ giải mã có thể tái tạo lại giá trị của các pixel thông qua công 
thức inverse discrete cosine transform (IDCT)
c
166
Nén ảnh
167
Nén ảnh – ví dụ
DCT
Tru
128
168
Nén ảnh – ví dụ
169
170
171
Nén ảnh
 Chuẩn JPEG 2000
 JPEG đã đưa ra một chuẩn nén ảnh mới là JPEG2000. JPEG2000 
sử dụng biến đổi Wavelet và các phương pháp mã hoá đặc biệt để
có được ảnh nén ưu việt hơn hẳn JPEG.
 JPEG2000 có nhiều chức năng đặc biệt hơn các chuẩn nén ảnh tĩnh
khác như JPEG hay GIF. Dưới đây là các chức năng ưu việt của
JPEG2000 so với các chuẩn nén ảnh tĩnh khác
 Cho chất lượng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất.
 Sử dụng được với truyền dẫn và hiển thị luỹ tiến về chất lượng, độ phân
giải, các thành phần màu và có tính định vị không gian.
 Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén.
 Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ liệu.
 Giải nén từng vùng trong ảnh mà không cần giải nén toàn bộ ảnh
 Có khả năng mã hoá ảnh với tỷ lệ nén theo từng vùng khác nhau
 Nén một lần nhưng có thể giải nén với nhiều cấp chất lượng tuỳ theo yêu
cầu của người sử dụng
172
Nén ảnh
173
Nén ảnh
174
Nén ảnh
175
Nén ảnh
So sánh chuẩn JPEG và JPEG2000 với tỉ lệ 0.25 bpp, CR = 32
176
Nén video 
 Đối với tín hiệu video số, số lượng bit được sử dụng để truyền
tải thông tin đối với mỗi miền tần số khác nhau, có nghĩa là: miền
tần số thấp, nơi chứa đựng nhiều thông tin, được sử dụng số
lượng bít lớn hơn và miền tần số cao, nơi chứa đựng ít thông tin, 
được sử dụng số lượng bít ít hơn. 
 Thực chất của kỹ thuật “nén video số” là loại bỏ đi các thông tin 
dư thừa. Các thông tin dư thừa trong nén video số thường là: 
 Độ dư thừa không gian giữa các pixel; 
 Độ dư thừa thời gian do các ảnh liên tiếp nhau; 
 Độ dư thừa do các thành phần màu biểu diễn từng pixel có độ tương quan
cao; 
 Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác suất xuất
hiện không đều nhau; 
 Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm nhận của
mắt).vv
177
Nén video
 MJPEG (Motion JPEG) – là việc sử dụng chuẩn mã
hóa video sử dụng các frame được mã hóa bằng
chuẩn nén ảnh JPEG
 Đơn giản – các frame độc lập với nhau
 Giới hạn mã hóa 1:20
 MJPEG được phát triển cho các máy tính cá nhân, 
hiện nay dùng các thiết bị khác. Hiện nay MJPEG 
được ứng dụng cho
 Máy quay số
 Thu nhận và chỉnh sửa video
 IP Camera
 Sử dụng cho các thiết bị hiển thị video
178
Nén video
 MPEG (Moving Picture Expert Group) là nhóm chuyên gia về
hình ảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây
dựng tiêu chuẩn cho tín hiệu Audio và Video số. Ngày nay, 
MPEG đã trở thành một kỹ thuật nén Audio và Video phổ biến
nhất
 MPEG-1, mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s và lưu trữ
trong đĩa CD.
 MPEG-2 (1990) : MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát
triển. (3-15Mbps)
 MPEG-4 (10/1998), Là chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng 
dụng về đồ hoạ và video tương tác hai chiều (games, videoconferencing) và
các ứng dụng multimedia tương tác hai chiều (World Wide Web, Internet 
video...) 
 MPEG-7: là một chuẩn dùng để mô tả các nội dung Multimedia, chứ không
phải là một chuẩn cho nén và mã hoá audio/ảnh động như MPEG-1, MPEG-2 
hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộng XML(Extansible
Markup Language) để lưu trữ các siêu dữ liệu Metadata, đính kèm timecode
để gắn thẻ cho các sự kiện, hay đồng bộ các dữ liệu. 
179
180
Nén video
 Các cấu trúc lấymẫu vỡ số hoá tín hiệu video
 Đối với truyền hình số NTSC vỡ PAL, chuỗi video 
gồm các khung hình (frame ảnh) có độ phân giải 576 
x 720, các dòng video chứa 720 điểm ảnh đ−ợc lấy
mẫu vỡ số hoá theo các cấu trúc sau :
181
Nén video
182
Nén video
183
Nén video
 Các chuẩn nén video hầu hết đều sử dụng 2 kỹ thuật
chính là :
 Nén video không dùng kỹ thuật phát hiện và bù chuyển động -
MJPEG
 Nén video dùng kỹ thuật phát hiện và bù chuyển động
 Nén ảnh tĩnh để giảm độ dư thừa không gian
 Đánh giá, ước lượng chuyển động để giảm độ dư thừa về mặt thời gian
184
Nén video
 Phân loại các frame video
 Frame I : là frame đầu tiên trong chuỗi video
 Frame P : (predicted frame) – frame được dự đoán tiếp theo
 Frame B (Bi-directional interpolated prediction frame) - frame được
dự đoán nội suy 2 chiều
185
Nén video
Cấu trúc
dòng bit MPEG 
186
187
Cấu trúc
dòng bit MPEG 
188
Nén video 
 Mô hình mã hóa MPEG 
189
Nén video
 Đánh giá chuyển động (Motion Estimation) : xác định
vector chuyển động
 Bù chuyển động (Motion Compensation) : khôi phục
ảnh bằng cách sử dụng vector chuyển động và sai số
chuyển động (phần sai lệch giữa 2 frame) 
190
Nén video 
 Quá trình nén frame I 
191
Nén video
 Quá trình nén frame P
Frame B ?
192
Giải thuật đối sánh, xác định vector 
chuyển động

File đính kèm:

  • pdfmultimedia_cac_ky_thuat_trong_da_phuong_tien.pdf