Luận án Nghiên cứu các đặc trưng tín hiệu và ràng buộc ngôn điệu để nâng cao chất lượng tổng hợp và nhận dạng Tiếng Việt
Ngày nay, với sự bùng nổ của xã hội thông tin, con người không còn chỉ có nhu
cầu giao tiếp với nhau nữa mà còn cần giao tiếp với những thiết bị điện tử. Hình thức
giao tiếp người – máy thông qua ngôn ngữ tự nhiên sẽ đem lại nhiều ứng dụng, góp
phần giải phóng sức lao động của con người. Chính vì vậy, vai trò của nhận dạng, tổng
hợp tiếng nói có tầm quan trọng đặc biệt liên quan đến quá trình phát triển của văn
minh nhân loại. Các ứng dụng nhận dạng và tổng hợp tiếng nói như Dragon của LH,
Viavoice, Google voice search, Siri của Apple v.v ngày càng trở nên thông dụng và
hữu ích trong cuộc sống.
Về các hệ thống tổng hợp tiếng nói, hiện nay đã có nhiều phương pháp tổng hợp
được nghiên cứu và ứng dụng trong thực tế như: tổng hợp theo cấu âm, tổng hợp bằng
ghép nối, cách điệu hóa đường F0 và hiện tượng ngôn điệu [23][25][27], tổng hợp theo
phương pháp thống kê dựa trên HMM [18][71][72] Tuy nhiên, vấn đề tổng hợp
giọng tự nhiên cho tới nay vẫn là một vấn đề mở, ngay cả trong các ngôn ngữ châu Âu
thông dụng như tiếng Anh. Bởi vì để tổng hợp được giọng tự nhiên đòi hỏi rất nhiều
yếu tố từ việc xử lý các đặc trưng tín hiệu, hiện tượng ngôn điệu và ngữ cảnh ứng dụng
(như trạng thái cảm xúc ) v.v
Tóm tắt nội dung tài liệu: Luận án Nghiên cứu các đặc trưng tín hiệu và ràng buộc ngôn điệu để nâng cao chất lượng tổng hợp và nhận dạng Tiếng Việt
1 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ NGÔ HOÀNG HUY NGHIÊN CỨU CÁC ĐẶC TRƯNG TÍN HIỆU VÀ RÀNG BUỘC NGÔN ĐIỆU ĐỂ NÂNG CAO CHẤT LƯỢNG TỔNG HỢP VÀ NHẬN DẠNG TIẾNG VIỆT LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội – 2016 2 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ NGÔ HOÀNG HUY NGHIÊN CỨU CÁC ĐẶC TRƯNG TÍN HIỆU VÀ RÀNG BUỘC NGÔN ĐIỆU ĐỂ NÂNG CAO CHẤT LƯỢNG TỔNG HỢP VÀ NHẬN DẠNG TIẾNG VIỆT Chuyên ngành: Cơ sở Toán học cho Tin học Mã số: 62 46 01 10 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. PGS.TS. LƯƠNG CHI MAI 2. PGS.TS. NGÔ QUỐC TẠO Hà Nội – 2016 3 LỜI CAM ĐOAN Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không sao chép từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định. Tác giả luận án Ngô Hoàng Huy 4 LỜI CẢM ƠN Luận án này báo cáo một phần các kết quả nghiên cứu và làm việc của tôi trong hơn hai chục năm qua. Trong suốt thời gian này ngoài nỗ lực làm việc của bản thân tôi, phòng Nhận dạng và Công nghệ Tri thức, Viện Công nghệ Thông tin đã tạo cho tôi một môi trường làm việc, điều kiện để thực hiện các nghiên cứu về chuyên nghành rộng là nhận dạng và chuyên nghành hẹp nhận dạng và tổng hợp tiếng Việt. Tôi xin chân thành cảm ơn PGS.TS Lương Chi Mai và PGS.TS Ngô Quốc Tạo đã chỉ dẫn tôi làm việc trong bước đường khoa học của tôi, tận tình chỉ dẫn tôi để hoàn thành được luận án này. Xin cảm ơn các đồng nghiệp tại Phòng Nhận dạng và Công nghệ tri thức, Viện Công nghệ Thông tin đã đóng góp những ý kiến thiết thực để tôi hiệu chỉnh lại các tiếp cận nghiên cứu của mình, cảm ơn các kỹ sư tại công ty Cổ phần Phần mềm và Công nghệ ứng dụng đã hỗ trợ tôi thử nghiệm các kết quả về tổng hợp và nhận dạng khẩu lệnh tiếng Việt trên nền tảng chip PSoC. Đặc biệt tôi xin bày tỏ lòng biết ơn sâu sắc tới vợ tôi Mai Thị Bạch Tuyết mà thiếu điều này chắc chắn tôi đã không đủ nghị lực để hoàn thành bản luận án này. 5 MỤC LỤC Danh mục các thuật ngữ và từ viết tắt i Danh sách bảng ii Danh sách hình vẽ iii MỞ ĐẦU 1 1. Tính cấp thiết của đề tài .................................................................................... 1 2. Mục tiêu, phạm vi nghiên cứu của luận án. ....................................................... 4 3. Phương pháp và nội dung nghiên cứu ............................................................... 5 4. Kết quả đạt được của luận án ............................................................................ 6 CHƯƠNG 1. TỔNG QUAN VỀ TỔNG HỢP VÀ NHẬN DẠNG TIẾNG NÓI 10 1.1. Tổng hợp tiếng nói ....................................................................................... 10 1.1.1. Chuẩn hóa văn bản và phân tích câu – xử lý ngôn ngữ tự nhiên ........ 11 1.1.2. Chuyển văn bản sang đơn vị tiếng nói .............................................. 11 1.1.3. Dự báo ngôn điệu ............................................................................. 11 1.1.4. Các phương pháp tổng hợp tiếng nói ................................................ 12 1.1.5. Các hệ thống tổng hợp tiếng nói tiếng Việt ....................................... 21 1.1.6. Các tham số ngôn điệu ..................................................................... 23 1.1.7. Tổng quan về âm học và các hiện tượng ngôn điệu tiếng Việt trong ngữ lưu ..................................................................................................... 25 1.1.8. Hiệu chỉnh đường tần số cơ bản ....................................................... 33 1.2. Nhận dạng tiếng nói ..................................................................................... 38 1.2.1. Liệt kê các lớp bài toán nhận dạng tiếng nói ..................................... 38 1.2.2. Môi trường thu nhận tín hiệu ............................................................ 39 1.2.3. Biểu diễn tiếng nói - đặc trưng tiếng nói ........................................... 40 6 1.2.4. Phương pháp nhận dạng tiếng nói ..................................................... 42 1.2.5. Các hệ thống nhận dạng tiếng nói tiếng Việt..................................... 43 1.3. Kết luận chương 1 ........................................................................................ 44 CHƯƠNG 2. XỬ LÝ TIẾNG NÓI VÀ CÁC MÔ HÌNH HỌC MÁY 46 2.1. Xử lý tiếng nói ............................................................................................. 46 2.1.1. Xử lý nhiễu ...................................................................................... 46 2.1.2. Một số loại nhiễu trong môi trường thực ......................................... 47 2.1.3. Trích chọn đặc trưng tiếng nói .......................................................... 50 2.1.4. Thuật toán PSOLA ........................................................................... 56 2.2. Mô hình dự báo CART ................................................................................ 59 2.3. Mô hình Markov ẩn (HMM, Hidden Markov Model) ................................... 63 2.3.1. Tham số của mô hình HMM ............................................................. 64 2.3.2. Nhận dạng tiếng nói với mô hình Markov ẩn .................................... 66 2.4. Kết luận chương 2 ........................................................................................ 67 CHƯƠNG 3. DỰ BÁO TRƯỜNG ĐỘ, ÂM LƯỢNG VÀ TỔNG HỢP THANH ĐIỆU TIẾNG VIỆT 68 3.1. Khảo sát một số đặc tính âm học tiếng Việt .................................................. 69 3.1.1. Đặc tính trường độ của âm tiết do ảnh hưởng của phụ âm và nguyên âm trong ngữ cảnh ..................................................................................... 70 3.1.2. Quy luật biến đổi thanh điệu trong ngữ cảnh .................................... 71 3.1.3. Quy luật biến đổi formant của nguyên âm trong ngữ cảnh ................ 73 3.1.4. Cách điệu hóa đường F0 của âm tiết tiếng Việt ................................ 78 3.2. Dự báo thông tin trường độ, âm lượng của âm tiết tiếng Việt trong ngữ cảnh câu ............................................................................................................. 86 3.2.1. Cơ sở dữ liệu tiếng nói huấn luyện mô hình dự báo .......................... 87 3.2.2. Dự báo ngôn điệu ............................................................................. 92 7 3.2.3. Thiết kế bộ phân tích ngôn điệu và xác định tham số huấn luyện dự báo trường độ và âm lượng ........................................................................ 93 3.2.4. Tổng hợp tiếng Việt trên hệ thống tài nguyên hạn chế .................... 101 3.3. Kết luận chương 3 ...................................................................................... 103 CHƯƠNG 4. KẾT HỢP THAM SỐ CẤU ÂM, FORMANT VÀ THANH ĐIỆU ĐỂ NÂNG CAO CHẤT LƯỢNG NHẬN DẠNG TIẾNG VIỆT 105 4.1. Nhận dạng thanh điệu tiếng Việt ................................................................ 105 4.2. Đặc trưng MFCC với phép chuẩn hóa độ dài cấu âm VTLN kết hợp với F0108 4.2.1. Phép chuẩn hóa VTLN ................................................................... 110 4.2.2. Tổ hợp giá trị F0 và chuẩn hóa VTLN ............................................ 112 4.2.3. Ước lượng tham số chuẩn hóa VTLN bằng phương pháp formant .. 117 4.3. Hệ thống nhận dạng tiếng Việt nhúng ........................................................ 124 4.3.1. Điều khiển thiết bị tự hành bằng tiếng nói ...................................... 126 4.3.2. Biểu diễn HMM trong bộ nhớ SRAM của chip với tính toán chấm tĩnh (fixed point) ............................................................................................ 130 4.4. Kết luận chương 4 ...................................................................................... 131 KẾT LUẬN 133 1. Kết quả về tổng hợp tiếng Việt ...................................................................... 133 1.1. Kết quả chính .................................................................................... 133 1.2.Kết quả khác ...................................................................................... 134 1.3.Một kết quả ứng dụng ........................................................................ 134 2. Kết quả về nhận dạng tiếng Việt ................................................................... 134 2.1. Kết quả chính .................................................................................... 134 2.2.Kết quả khác ...................................................................................... 135 2.3.Một kết quả ứng dụng ........................................................................ 136 3. Hướng phát triển ........................................................................................... 136 8 DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ 138 TÀI LIỆU THAM KHẢO 140 PHỤ LỤC 149 1. Cách tổ chức cây dự báo CART của Wagon/Festival .................................... 153 1.1. Sự hỗn tạp trong dữ liệu (tạp âm) ...................................................... 153 1.2. Định dạng dữ liệu .............................................................................. 156 1.3. Xây dựng cây .................................................................................... 161 2. Phân loại âm vị tiếng Việt ............................................................................. 163 3. Cơ sở dữ liệu ngữ âm .................................................................................... 171 4. Các câu trích từ tập truyện “Dế mèn phiêu lưu ký” ....................................... 213 i Danh mục các thuật ngữ và từ viết tắt Từ viết tắt Tên đầy đủ ADC Analog-Digital-Converter ADPCM Adaptive differential pulse-code modulation ANN Artificial neural network CART Class And Regression Tree CD-HMM Continuous-Density Hidden Markov Model CMS Cepstral-mean-subtraction CSDL Cơ sở dữ liệu C-V Consonant-Vow C-V-C Consonant-Vow-Consonant dB Decibel DFT Discrete Fourier Transform EM Expectation Maximization FFT Fast Fourier Transform F0 Fundamental Frequency GMM Gaussian Mixture Models GPIO General-purpose Input/Output HMM Hidden Markov Model HTK Hidden Markov Model Toolkit IDFT Inverse Discrete Fourier Transform IFFT Inverse Fast Fourier Transform LPC Linear Predictive Coding LPCC Linear Predictive Cepstral Coefficient LPF Low Pass filter LSF Line Spectral Frequency LSP Line Spectrum Pair ii MAP Maximum A posteriori MFCC Mel Frequency Cepstral Coefficient ML Maximum Likelihood PDF Probility Density Function POS Part-Of-speech PSOC Programmable System On Chip PSOLA Pitch Synchronous Overlap Add RMSE Root Mean Square Error SD Speaker Dependent SI Speaker Independent SS Spectral Subtraction SRAM Static Random Access Memory STC Shared decision Tree Cluster ToBI Tones and Break Indices TTS Text To Speech VTLN Vocal Tract Length Normalization VAD Voice Activity Detection ZCR Zero Crossing Rate WF Wiener Filter VTL Vocal Tract Length ii Danh sách bảng 1. 1 Bảng so sánh một số sản phẩm tổng hợp tiếng Việt đã công bố ....................... 21 1. 2 Các tham số đặc trưng của ngôn điệu .............................................................. 24 1. 3 Phân loại âm tiết tiếng Việt. ............................................................................ 27 1. 4 Các loại nhận dạng tiếng nói ........................................................................... 39 1. 5 Liệt kê các môi trường theo mức nhiễu ................................................................39 2. 1 Thuật toán nhận dạng tiếng nói dựa trên HMM với đặc trưng MFCC. ............. 66 3. 1. Trường độ nguyên âm trong kết hợp với thanh điệu. ........................................... 72 3. 2. Trường độ nguyên âm trong kết hợp với thanh điệu. ........................................... 73 3. 3. Vùng tần số của các nguyên âm .......................................................................... 76 3. 4. Vùng tần số formant trung bình của các nguyên âm kết hợp với thanh điệu. ...... 76 3. 5. Vùng tần số formant trung bình của các nguyên âm kết hợp với thanh điệu. ...... 77 3. 6. Biểu diễn các 6 thanh điệu tiếng Việt bằng các lệnh thanh điệu .......................... 83 3. 7. Giá trị trung bình và độ lệch chuẩn của các tham số Fujisaki cho các thanh điệu. 84 3. 8. Bảng độ dài âm vị không tính ngữ cảnh .............................................................. 87 3. 9. Độ dài nguyên âm a ràng buộc bởi phụ âm đầu, âm cuối .................................... 88 3. 10. Bảng độ dài âm cuối ràng buộc bởi nguyên âm ................................................. 88 3. 11. Bảng độ dài phụ âm đầu ràng buộc bởi nguyên âm ........................................... 89 3. 12. Bảng độ dài thanh điệu theo âm tiết ràng buộc bởi âm kết thúc ......................... 90 3. 13. Bảng tham số đầu vào cho mô hình CART .............................................................95 4. 1 Thuật toán nhận dạng tiếng nói dựa trên HMM với đặc trưng MFCC ......... 109 4. 2 Một số dạng của phép hiệu chỉnh tần số ...................................................... 111 4. 3 Bảng kết quả thực nghiệm kiểm tra ............................................................. 116 4. 4 Bảng kết quả giải mã tên trường của người đọc. .......................................... 117 4. 5 Bảng kết quả thực nghiệm kiểm tra ............................................................... 123 4. 6 Bảng cấu hình GAIN kết hợp bộ lọc thông thấp. ........................................... 126 4. 7 Khẩu lệnh điều khiển xe lăn. ......................................................................... 128 iii 4. 8 Khẩu lệnh điều khiển robot hút bụi. .............................................................. 129 4. 9 Các bước của chương trình thử nghiệm trên máy tính ....................................... 130 5. 1 Phân chia nguyên âm tiếng Việt theo độ nâng của lưỡi ................................ 165 5. 2 Bảng phiên âm tiếng Việt .............................................................................. 167 iii Danh sách hình vẽ 1. 1 Hệ thống TTS tổng quát. ................................................................................. 10 1. 2 Xử lý ngôn điệu tiếng Việt .............................................................................. 12 1. 3 Sơ đồ hệ thống tổng hợp ghép nối. .................................................................. 17 1. 4 Tổng hợp tiếng nói theo HMM [71]. .................................. ... đương trong gió tràn ngập phơi phới cho tĩnh tâm lại 339. khi trở vào đám hội trên võ đài đã đương vào cuộc thi tài 340. tôi rất ngạc nhiên thấy chũi đứng sừng sững trên đài sắp đấu với anh bọ muỗm 341. thì ra chú chũi nhà tôi bấy lâu vẫn còn căm nhà bọ muỗm 342. cái trận đòn ác của các mụ bọ muỗm nanh ác ngày ấy vẫn chưa thể quên 343. còn căm nặng đến độ bây giờ chỉ gặp một gã bọ muỗm xa lạ cũng khiến chũi nổi máu đòn thù 344. chũi lên đài ngay 345. gã bọ muỗm kia đã đánh ngã mấy địch thủ nhép hôm qua 346. đằng đuôi mắc thêm lưỡi gươm cong hoắt 347. đầu gã lớn mút nhọn lại húc rất khỏe 348. hai vành râu trắng phau 349. đôi mắt to hó như mắt cá 350. hai tảng răng thì đen và nhọn khoằm khoặm 351. nếu không có chũi lên võ đài thì bọ muỗm được đấu thẳng với bọ ngựa để tranh chức trạng võ này 352. hai võ sĩ đã ra đài 353. cụ châu chấu già lụ khụ đã bạc cả lưng có cái gân đen nổi gồ trên chán ra ngồi cầm trịch 354. chũi và bọ muỗm sau khi mỗi anh đi một bài võ ra mắt như các tay đô vật múa lên đâì rồi đứng lại ngó nhau một giây từ từ đưa chân lên vuốt râu đàng hoàng mấy cái bất thình lình ập vào đấu đá liền 355. chũi xử đôi càng khéo lắm 356. từ ngày ra đi chũi học thêm được nhiều miếng võ đường quyền coi rất ngoạn mục và kín 357. bọ muỗm kia thì không cần võ chỉ cậy sức cứ lăn xả vào thọc gươm và cắn lia 230 lịa 358. loanh qoanh một lát bọ muỗm đã mệt phờ 359. bấy giờ chũi mới mở sức 360. chũi nhẩy phốc lên đưa hai quả trùy càng ép bẹp vỡ cặp kính bảo vệ mắt của bọ muỗm rồi kết thúc thêm một đá làm gã kia ngã ngửa rướn lưng mấy lần mà không dậy được 361. cụ châu chấu cầm trịch thong thả bước tới dắt chàng được trận ra một bên và tuyên bố kẻ thắng trận 362. cả bãi xôn xao 363. vừa hoan hô vừa lạ lùng vì chưa ai biết võ sĩ chũi tài giỏi ấy quê ở đâu ta 364. võ sĩ dế chũi thắng võ sĩ bọ muỗm 365. còn ai lên đấu với võ sĩ dế chũi 366. tiếng ông cụ gọi loa vang đài 367. ai nấy lặng yên nghe lặng yên nghe 368. bỗng một tiếng đáp vang động 369. rồi anh chàng bọ ngựa ban nãy vừa lôi thôi với tôi nhảy vót lên 370. cơ nguy cho chũi vì xem chàng chũi có vẻ mệt 371. vả lại bọ ngựa ngông ngáo nhớ chuyện ban nãy ở quán hàng cái bực mình trong tôi tức tốc trở lại 372. tôi phắt lên đài quát 373. khoan khoan đây trước đã nhớ hẹn chứ 374. bọ ngựa lùi lại rồi à một tiếng rõ to nghênh hai thanh gươm lên vẫn một điệu khinh bạc và tự cao tự đại rất là ngô nghê 375. lại như lệ trên trường đấu ngày ấy trước khi vào cuộc mỗi bên biểu diễn một vài đường quyền theo sở trường của mình 376. bọ ngựa đứng vươn mình đi bài xong kiếm 377. bóng kiếm loang loáng mù mịt như hoa may điệu bộ khá đẹp mắt 231 378. tôi chẳng cần đi bài gì hết 379. tôi đứng nghiêng người về đằng trước hếch hai càng lên 380. cứ hai càng ấy tôi đạp phóng tanh tách liên liến một hồi 381. gió tuôn thành luồng xuống bay cả áo xanh áo đỏ các cô cào cào đứng gần 382. tôi ra oai sức khỏe 383. lúc vào đấu bọ ngựa cao nên lợi đòn 384. hai gươm hắn bổ xuống đầu tôi chan chát 385. nhưng đầu tôi đầu gỗ lim 386. tôi lựa cách đỡ không vần gì hết 387. còn tôi đoản người tôi nhè bụng hắn mà đá khiến có lúc hắn phải hạ gươm xuống đỡ mất đà đâm loạng choạng 388. hắn định lách gươm nghiêng vào khe họng tôi chỗ hiểm 389. cuống họng tôi có khe thịt dễ đứt như chơi 390. thấy thế nguy tôi gỡ đòn cúi xuống thúc nhanh một răng rất sâu vào bụng hắn 391. choáng người bọ ngựa nhảy lộn qua lưng tôi 392. tôi cũng chỉ đợi có thế 393. vừa đúng đà càng lừa vào miếng võ gia truyền của nhà dế 394. tôi lấy tấn đá hậu đánh phách 395. một cái đá trời giáng vào giữa mặt anh chàng 396. chàng bọ ngựa kiêu ngạo rú lên một tiếng bắn tung lên trời rơi tọt ra ngoài võ đài ngã vào đám đông xôn xao 397. tôi đã hạ địch thủ một cách vẻ vang 398. trong khi dưới đám hội còn đương ồn ào nhốn nháo vì không ai ngờ võ sĩ bọ ngựa giỏi võ nhất vùng lại thua nhanh và thua đau như thế và thua bởi một chàng dế mèn lạ mặt ở đâu đến 399. còn chưa ai hết lạ lùng thì cụ châu chấu cầm trịch lại trịnh trọng dơ loa lên ba lần đều đặn hô vang vang xuống 232 400. tôi xin hỏi đông đủ các võ sĩ trong thiên hạ tề tịu quanh võ đài 401. có còn ai lên nữa chăng 402. cả đám hội im lặng 403. cụ châu chấu cầm trịch lại hô tiếp 404. bây giờ trận tranh hùng kết thúc 405. ô hay tôi sẽ đấu võ với chũi 406. tôi nhìn sang chũi 407. vừa lúc chũi nhìn lại tôi 408. chúng tôi cùng nhau đi đến đất này để đấu võ tranh quyền với nhau ý 409. bất giác tôi tiến lại chũi đứng thẳng hai chân trước khoác vai chũi 410. hai chúng tôi hướng xuống dưới võ đài 411. khắp bãi rờn bóng hoa may tụ tập hàng nghìn vạn các loài trong vùng đi xem hội võ 412. tôi nói to lên rằng 413. thưa chư vị anh em chúng tôi vừa từ phương xa tới đây 414. cái chủ đích của chúng tôi thật không định tranh lèo giật giải gì ở đất này 415. đất lành chim đậu thấy phong tục vui thì chúng tôi đến góp mặt vui chung mà thôi 416. bây giờ cái điều chúng tôi không chờ đợi là anh hùng bốn phương đều đã lui cả mà nhường quyền đọ sức cao thấp sau cùng cho anh em chúng tôi 417. với sự tranh đua anh em tôi xin lỗi không thể 418. bởi vì sao chắc các vị đã rõ 419. còn về ngôi thứ trách nhiệm thì anh em chúng tôi cũng xin lỗi không dám 420. anh em chúng tôi chỉ là hai kẻ giang hồ vốn trọng nghĩa khinh tài thấy đất que đẹp đẽ thì ghé tời trên đường đi mà không ý định ở đâu cả 421. dám xin chư vị xét cho 422. tôi vừa nói xong ở dưới vang lên tiếng the thé tiếng ầm ầm 233 423. kẻ thì bảo nhất quyết phải mời chúng tôi ra thi đấu lệ vùng này nghìn xưa như thế 424. kẻ thì rằng thôi 425. một cụ châu chấu một cụ bọ ngựa một cụ cành cạch một cụ cào cào một cụ niềng nghiễng 426. các cụ ra nói với chúng tôi rằng 427. thưa hai võ sĩ đất lành chim đậu 428. hai võ sĩ qua đây lại có lòng lên thi thố tài nghệ siêu quần 429. thiên hạ không còn ai đối địch nổi 430. thật là phúc cho chúng tôi 431. vả như thế cái lệ đấu có thể bỏ đi được 432. đó là nguyện vọng và phong tục đất chúng tôi hàng bao đời vẫn chọn tài như thế không thể khác 433. tôi thì hết lời từ chối 434. còn chũi đứng lặng không nói 435. về sau tôi mới biết sự im lặng của chũi có một ý nghĩa riêng 436. tôi đành phải nhận 437. thế là cả đám hội ầm vang lời hoan hô tôn chúng tôi lên là chánh phó thủ lĩnh đứng đầu các làng trong vùng cỏ may này 438. cả đám hội xô vào làm kiệu rước hai tôi lên đi chen trong đám đông và hoa cỏ may 439. các chị cào cào áo xanh áo đỏ làm duyên đứng nghiêng khuôn mặt dài ngoẵng nhìn theo chúng tôi một đỗi rất lâu tỏ vẻ mến phục 440. tất cả tung cỏ tung hoa may dấu hiệu hoan hô 441. lồng dân cử bài hát rầm rộ 442. rồi tất cả mừng rỡ cầm tay nhau khiêu vũ 443. cành cạch với châu chấu cào cào với bọ muỗm nhảy múa linh đình 234 444. từ trong hang trong lá ra đến ngoài bãi ngoài đồng hoa may trắng ngát chân trời 445. tôi bước lên đài uốn éo múa càng rung cánh trổ một bài hát rất du dương 446. chũi thì hớn hở hơn ai hết 447. thì ra lúc nãy cu cậu im không nói chỉ là sợ tôi từ chối cái địa vị thủ lĩnh 448. đến khi thấy tôi nhận lời chũi ta hét inh lên múa rối rít hai càng khiến những bác cành cạch nhút nhát mới đầu cũng sợ đáo để 449. tôi thì tôi hơi buồn và băn khoăn 450. nể quá mà phải nhận lời đó thôi 451. tôi vẫn chỉ muốn được thỏa chí nguyện của mình là đi đây đi đó thế đủ sung sướng rồi 452. trái với tôi chũi rất thú vị 453. tôi bảo chũi 454. đừng tưởng thấy an nhàn mà vui 455. đời ta trẻ lắm mà sống chỉ thấy an nhàn thế này thì buồn tẻ khác nào khi chúng ta còn ở trong hang quê nhà 456. chũi ơi đừng quên chúng mình đương dong duổi trên đường đi tìm cái ý nghĩa thật của cuộc đời này 457. mà cũng đừng để cho cái an nhàn giữ được chân ta 458. việc đời khó lắm và không chỉ có thế đâu 459. quả nhiên mùa đông năm ấy xảy ra một việc biến lớn 460. cỏ may trên bờ đường đi đã tàn 461. những con bò gầy tọp giũi toét cả mũi cũng chỉ được mấy chĩa rễ cỏ khô 462. người trong làng ra đồng gặt lúa 463. cánh đồng vàng rượi kia đã được người ta lấy liềm gặt bó từng lượm cái đòn sóc đâm ngang thành từng gánh quảy về sân 464. trên mênh mông chỉ còn trơ lại những gốc rạ khô 465. thế là mùa rét đã tới 235 466. cánh đồng vắng ngắt màu xám trên trời và màu xám dưới đất đã liền vào nhau và ở giữa có gió gào suốt đêm ngày 467. trẻ con ra ngoài đồng thì lạnh tai và đỏ hắt mũi 468. rét quá rúm cả chân 469. chẳng ai có thể ở rốn trên cánh đồng không được 470. phải đi tìm nơi tránh rét 471. nếu cứ phong phanh giữa trời suốt mùa đông thì đến chết cả 472. bởi thế đã thành thói quen từ xưa cứ mùa rét đến thì các loài sống trong vùng này lại bỏ cánh đồng lạnh ngắt lạnh ngơ mà lũ lượt đi kiếm nơi tránh rét 473. có khi phải tranh cướp đánh nhau mới tìm được chỗ 474. bởi vì trong mùa rét nhiều loài khác cũng đã tìm kiếm chỗ ở ấm như thói quen của châu chấu 475. tôi bảo chũi 476. có phải thế không chũi đã thấy nhé cuộc đời này chưa thể ngồi yên để cười được 477. lo cho cái sống cũng đã gay gắt lám đây 478. kìa bao nhiêu loài phải xô đẩy nhau đi tìm chỗ ẩn cho mùa đông tháng giá 479. những con chim nhỏ xấu số ở dưới lạnh nằm chết trong tuyết 480. mùa đông đã đem cái rét khủng khiếp đến kìa 481. tôi bảo bà con rằng 482. cái rét đã đến ngoài đồng rồi 483. chúng ta hãy kíp đi tìm nơi ấm áp mà trú ẩn 484. chẳng mấy lúc không còn thấy bóng ai ngoài trời nữa 485. bọn chuồn chuồn cánh mỏng cả các cậu kỉm kìm kim ốm o biết mình không chịu nổi nửa cơn gió giật đã mò mẫm đi trước nhất 486. cánh anh em nhà niềng nghiễng thì lặn xuống bùn với anh cọng vó bên cạnh những cua những ếch lo rét đương vội vã đắp những cái mà lô nhô quanh bờ các đầm ao 236 487. châu chấu cào cào bọ ngựa bọ muỗm thì đi tìm khe dứa dại 488. trong mùa đông chỉ có những bụi dứa dại vẫn xanh nguyên 489. mỗi chiếc là dứa dỏng cái tai cứng lên nền trời xám 490. kẽ lá dứa sâu hoắm có thể chui được vào đấy nằm chổng đuôi ra bất chấp gió mưa bên ngoài 491. cứ chui vào đấy nằm yên đấy cho đến khi những ngày xuân trở lại thấy cái ấm đậu xuống hai vai và nghe thấy tiếng con chim chích kêu vui tranh trách ngoài khe lá thế là biết mùa mới đã tới lúc ấy mới bước ra 492. chúng tôi đương đi tìm chỗ ở mùa đông 493. tìm chỗ ở mùa đông là việc năm nào cũng phải làm và bao giờ cũng gian nan 494. bởi vì không bao giờ và không ở đâu chỗ nào cũng cứ đến thì đã sắn chỗ 495. ấy thế là cái cảnh tranh dành lắm khi đổ máu lại thường diễn ra 496. ngoài đồng mây đen cuồn cuộn gió tan tác mặt đất và gió thổi lùa cái giá buốt vào tận ruột gan 497. không ai muốn cất một bước 498. thế mà vẫn phải đi đi mãi đi mãi vẫn chưa tìm thấy đâu chỗ ẩn náu 499. khe lá nào gốc cây nào cũng đầy rẫy các loài áo mỏng vào tránh rét chốn rét 500. mỗi sáng ra lại bỏ lại bỏ lại ven đường mấy cái xác bạn rất đau thương mà vẫn chưa bới được nơi trú ngụ 501. lại phải đánh nhau thôi 502. một là sống hai là chết 503. có đánh nhau mới giành được chỗ ở 504. tiếng bàn tán và than thở như thế trong đám đông mỗi lúc càng xôn xao 505. mấy anh bọ muỗm cao cẳng rón chân đi thám thính xem đã ai đến ở chưa 506. quân thám thính về báo 507. cả đoàn sau lưng chúng tôi la ó và kêu ràm rĩ 508. họ không muốn đi 237 509. họ không đi nổi nữa 510. tôi chù chừ một lát 511. rồi sau thấy đám đông ùn lên nhốn nháo 512. thế là tôi cũng hùa theo 513. chúng tôi kêu lên cứ xông vào đánh nhau thì đánh nhau chết thôi 514. thế là chúng tôi kéo đến từng gốc dứa leo lên lách vào khe lá đầy gai cụ ở ngoài cứ cắn đuôi từng châu chấu voi mà lôi giật lùi ra 515. khó chịu bọn châu chấu voi phải nhảy cả ra 516. thế là chúng tôi một phần tranh nhau nhảy vào khe dứa hở 517. một phần thì xúm lại đánh cho châu chấu voi không quay vào được nữa 518. bọn châu chấu voi khỏe lắm 519. anh nào cũng rất hùng dũng và hiên ngang 520. chẳng trách họ mang tên là châu chấu voi 521. này một châu chấu voi đương thoắt xông tới 522. sắc xanh biếc lưng cao nhọn và ngang ngạnh lên 523. hai chiếc râu trổ ra dữ như hai cái đinh 524. chẳng cần biết mình có thể yếu thế bởi vì mỗi châu chấu voi to gấp mấy lần châu chấu nhưng chúng tôi cứ lăn xả vào vây đánh 525. chúng tôi đương hăng đương liều 526. choảng nhau rối rít đến tận chiều cũng chưa ngã ngũ bên được bên thua 527. đám đã chui vào chiếm khe dứa sợ quá lại phải nhảo cả ra 528. thế là chúng tôi vẫn long đong bên ngoài trời rét buốt đến tận óc 529. nhưng có điều đau đơn cho tôi là chũi bị châu chấu voi bắt làm tù binh 530. chũi bị châu chấu voi bắt làm tù binh rồi 531. cả đêm tôi trằn trọc lo không chợp được mắt 532. mờ mờ hôm sau chúng tôi đông hàng nghìn kéo vao vây rặng dứa 533. phải cứu chũi kì được trước nhất 238 534. nhưng khi xô lên nhòm vào khe lá thì lạ thay rỗng tuếch không còn bóng một châu chấu voi 535. họ đã rút đi từ lúc nào 536. có lẽ sợ chúng tôi đông quá và tránh cái hung hăng quyết choảng nhau thí mạng của chúng tôi 537. họ đã đi từ ban đêm 538. thôi thế dù sao cũng là xong nỗi lo mùa đông 539. nhưng được chỗ ở ấm rồi mà tôi cứ ngao ngán cả người 540. bởi vì lúc rút chạy châu chấu voi đã mang đi cả tù bình 541. chũi mất tích rồi 542. chúng tôi vào ở kín cả trong bụi dứa 543. ngày đêm trên khe gió hú gió gào bên ngoài nhưng ở trong vẫn ấm áp và êm đềm như thường 544. khi nơi ăn chốn ở đầy đủ cả tôi mới nói rằng 545. trong trận xung đột vừa rồi chẳng may em tôi bị cầm tù 546. nó phải châu chấu voi đầy đi đến tận xứ xở nào không rõ 547. ngày trước anh em tôi đã thề cùng nhau sinh tử 548. tôi phải đi tìm cùng trời cuối đất nào tôi cũng đi bao giờ gặp được thì anh em tôi lại trở về đây 549. ai nấy xúm lại can ngăn không muốn để tôi đi 550. vả lại tù chân một chỗ cũng đã lâu tôi nóng ruột lắm 551. biết không thể lưu tôi lại ai cũng ngao ngán 552. họ dặn đi dặn lại rằng hễ tìm được chũi thì thế nào cũng phải trở về 553. chư vị hãy yên tâm 554. mặt đất rộng mà hẹp 555. thế nào chúng ta cũng còn khi gặp nhau 556. chia tay trong lưu luyến tôi cũng bịn rịn tuy không khóc nhưng lòng nao nao bùi 239 ngùi 557. cảnh biệt ly bao giờ chẳng vậy 558. thế là khăn gói gió đưa tôi lại bước chân đi 559. bây giờ đã tàn mùa hoa may từ lâu 560. trên đồng bãi và bờ ruộng chỉ còn xám mờ những đám gốc rạ và gốc cỏ của trẻ chăn trâu đã nhổ lên chất đống để đốt sưởi 561. đám khói cỏ may xanh ngắt trong vòm trời gió buốt càng rợn càng thê lương 562. trời đông rét run cánh run râu mà cả làng châu chấu đã nhảy cả ra ngoài khe đội gió tiễn tôi qua mấy dặm đường mới chịu trở lại 563. tôi đuổi theo châu chấu voi lần mò tìm kiếm thăm hỏi 564. ngược lên phía bắc cứ ngắm bụi cây mùa đông trơ trụi xa xa mà đi tới 565. bước cao bước thấp đi hết mùa đông sang mùa xuân 566. có khi tôi ngửa mặt lên vòm không gọi to 567. em ơi giờ em ở đâu.
File đính kèm:
- luan_an_nghien_cuu_cac_dac_trung_tin_hieu_va_rang_buoc_ngon.pdf
- Thong tin dong gop LA_ Ngo Hoang Huy.pdf
- Tom Tat LATS Ngo Hoang Huy.pdf