Luận án Sử dụng ngôn ngữ trục trong dịch đa ngữ
Cùng với sự phát triển của công nghệ, con người đã tạo ra một lượng thông
tin khổng lồ trên mạng Internet được cung cấp từ hàng triệu Website trên khắp thế
giới. Nhưng chúng ta không thể khai thác hết thông tin bởi nhiều lý do và một trong
những lý do quan trọng nhất là rào cản về ngôn ngữ. Vấn đề đặt ra là làm thế nào để
mọi người trên thế giới có thể khai thác hết nguồn thông tin trên Internet mà không
bị hạn chế bởi ngôn ngữ? Hiện có hai giải pháp chính để giải quyết vấn đề này: thứ
nhất là phát triển các hệ thống, các ứng dụng, các nguồn dữ liệu đa ngữ để người sử
dụng có thể lựa chọn ngôn ngữ mà họ muốn khi sử dụng; thứ hai là ứng dụng các
phần mềm dịch tự động để dịch các giao diện, nội dung từ ngôn ngữ hiện có sang
ngôn ngữ mà người sử dụng chọn lựa.
Hiện có nhiều hệ thống dịch đa ngữ được xây dựng với nhiều hướng tiếp cận
khác nhau và chất lượng bản dịch ngày càng được cải thiện. Tuy nhiên, đầu ra bản
dịch của các hệ thống này hầu hết chỉ mang tính tham khảo vì chưa thể hiện hết ý
nghĩa, văn phong của câu nguồn. Hơn nữa trên thế giới hiện đang sử dụng hơn
5. ngôn ngữ có chữ viết, việc phát triển một hệ thống dịch đa ngữ cho từng cặp
ngôn ngữ là vô cùng khó khăn và nhất là những ngôn ngữ có số lượng người dùng
ít1. Một trong những hướng tiếp cận mới trong dịch đa ngữ đang được quan tâm là
sử dụng ngôn ngữ trục để dịch, hướng tiếp cận này giảm chi phí xây dựng phần
mềm từ (n*(n-1)) xuống còn (2*n) và giải quyết các cặp ngôn ngữ thiếu tài nguyên
hoặc không tương đồng cấu trúc ngữ pháp [13]
Tóm tắt nội dung tài liệu: Luận án Sử dụng ngôn ngữ trục trong dịch đa ngữ
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG PHAN THỊ LỆ THUYỀN SỬ DỤNG NGÔN NGỮ TRỤC TRONG DỊCH ĐA NGỮ LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG PHAN THỊ LỆ THUYỀN SỬ DỤNG NGÔN NGỮ TRỤC TRONG DỊCH ĐA NGỮ Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 62 48 01 01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Người hướng dẫn khoa học: PGS.TS. Võ Trung Hùng Đà Nẵng 2018 LỜI CAM ĐOAN Tôi cam đoan đây là kết quả nghiên cứu của riêng tôi. Các nội dung và kết quả nghiên cứu được trình bày trong Luận án là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Tác giả NCS. Phan Thị Lệ Thuyền LỜI CẢM ƠN - Trước tiên, tác giả xin gửi lời cảm ơn đến Ban Đào tạo - Đại học Đà Nẵng, Khoa Công nghệ Thông tin, Phòng Đào tạo Trường Đại học Bách khoa - Đại học Đà Nẵng đã tạo điều kiện thuật lợi trong thời gian học tập và nghiên cứu. Tác giả muốn tri ân đến các Thầy Cô giáo Khoa Công nghệ Thông tin Trường Đại học Bách khoa - Đại học Đà Nẵng, đặc biệt là thầy Võ Trung Hùng đã tận tình giúp đỡ tác giả từ những bước đi đầu tiên hình thành ý tưởng, cũng như trong suốt quá trình nghiên cứu. Thầy luôn ủng hộ, động viên và tạo điều kiện tốt nhất để tác giả hoàn thành luận án. Tác giả nhận thấy sự trưởng thành sau những năm được học tập và nghiên cứu dưới sự hướng dẫn của Thầy. Tác giả chân thành cảm ơn các chuyên gia, các nhà ngôn ngữ học (PGS.TS Nguyễn Ngọc Chinh, TS. Nguyễn Quý Thành) đã dành thời gian để hỗ trợ tác giả nghiên cứu về mặt ngôn ngữ học, kiểm tra, đánh giá các kết quả dịch tự động và so sánh chất lượng dịch các hệ thống. Sự giúp đỡ của các nhà ngôn ngữ học đã giúp ích rất nhiều trong suốt quá trình nghiên cứu và hoàn thành báo cáo luận án này. Tác giả xin gửi lời cảm ơn chân thành tới các anh chị NCS của Khoa Công nghệ Thông tin Trường Đại học Bách khoa - Đại học Đà Nẵng, những người thân và bạn bè luôn bên cạnh động viên, hỗ trợ về mặt tinh thần để tác giả vượt qua khó khăn và hoàn thành tốt luận án. -i- MỤC LỤC DANH MỤC HÌNH VẼ ................................................................................................... iv DANH MỤC BẢNG ................................................................................................... vii MỞ ĐẦU ....................................................................................................................... 1 Chương 1. TỔNG QUAN VỀ DỊCH MÁY VÀ NGÔN NGỮ UNL ........................ 7 1.1. Một số khái niệm sử dụng trong luận án ............................................................. 7 1.2. Một số hướng tiếp cận trong dịch tự động .......................................................... 9 1.2.1. Dịch máy dựa trên luật .............................................................................. 10 1.2.2. Dịch máy dựa trên ngữ liệu ....................................................................... 12 1.2.3. Phương pháp dịch kết hợp ......................................................................... 14 1.2.4. Đánh giá .................................................................................................... 15 1.3. Dịch đa ngữ ....................................................................................................... 16 1.4. Vấn đề dịch tự động cho tiếng Việt................................................................... 20 1.5. Tổng quan về UNL ............................................................................................ 22 1.5.1. Giới thiệu ................................................................................................... 22 1.5.2. Ngôn ngữ UNL ........................................................................................... 22 1.5.3. Hệ thống UNL ............................................................................................ 29 1.5.4. Một số kết quả nghiên cứu liên quan ......................................................... 31 1.5.5. Ứng dụng UNL làm ngôn ngữ trục trong hệ thống dịch đa ngữ ............... 33 1.6. Tiểu kết chương ................................................................................................. 35 Chương 2. ĐỀ XUẤT MÔ HÌNH DỊCH TIẾNG VIỆT - UNL ............................. 37 2.1. Đặt vấn đề .......................................................................................................... 37 2.2. Ngữ pháp tiếng Việt .......................................................................................... 39 2.3. Đề xuất mô hình dịch ........................................................................................ 41 -ii- 2.3.1. Công cụ EnCoVie ....................................................................................... 42 2.3.2. Công cụ DeCoVie ...................................................................................... 45 2.3.3. Từ điển trong UNL ..................................................................................... 46 2.3.4. Luật ngữ pháp trong UNL ......................................................................... 49 2.4. Một số vấn đề cần xử lý cho tiếng Việt............................................................. 56 2.5. Tiểu kết chương ................................................................................................. 58 Chương 3. GIẢI PHÁP XÂY DỰNG TỪ ĐIỂN VÀ LUẬT .................................. 60 3.1. Giải pháp xây dựng từ điển tiếng Việt - UNL................................................... 60 3.2. Giải pháp xây dựng luật ngữ pháp .................................................................... 69 3.2.1. Xây dựng luật mã hóa ................................................................................ 69 3.2.2. Xây dựng luật giải mã ................................................................................ 83 3.3. Tiểu kết chương ................................................................................................. 94 Chương 4. THỬ NGHIỆM VÀ ĐÁNH GIÁ ............................................................ 96 4.1. Xây dựng công cụ EnCoVie và DeCoVie ......................................................... 96 4.1.1. Xây dựng công cụ EnCoVie ....................................................................... 96 4.1.2. Xây dựng công cụ DeCoVie ....................................................................... 99 4.2. Thử nghiệm và đánh giá .................................................................................. 114 4.2.1. Từ điển tiếng Việt – UNL ......................................................................... 114 4.2.2. Dịch đa ngữ qua ngôn ngữ trục UNL ...................................................... 115 4.3. Tiểu kết chương ............................................................................................... 122 KẾT L ẬN ............................................................................................................... 123 TÀI LIỆ THAM KHẢO ....................................................................................... 128 PHỤ LỤC .................................................................................................................. 137 -iii- ANH MỤC CÁC TỪ VIẾT T T LGW Left Generation Window Cửa sổ tạo ra bên trái LW Left Window Cửa sổ trái RGW Right Generation Window Cửa sổ tạo ra bên phải RW Right Window Cửa sổ phải UNL Universal Networking Language Ngôn ngữ mạng dùng chung UNLKB Universal Networking Language Cơ sở tri thức của ngôn ngữ Knowledge Base mạng dùng chung UW Universal Word Từ vựng chung -iv- ANH MỤC HÌNH VẼ Hình . . Sơ đồ hệ thống dịch trực tiếp [13]............................................................. 11 Hình . . Sơ đồ hệ thống dịch chuyển đổi [13] ........................................................ 11 Hình . . Sơ đồ hệ thống dịch qua ngôn ngữ trung gian [13]................................... 12 Hình . . Sơ đồ hệ thống dịch dựa trên ví dụ [13] .................................................... 13 Hình . . Sơ đồ hệ thống dịch dựa trên thống kê [13] .............................................. 14 Hình . . Kết hợp phương pháp dịch dựa trên luật và thống kê [13] ....................... 14 Hình . . Mô hình dịch máy dựa trên luật ................................................................ 15 Hình . . Dịch trực tiếp giữa các cặp ngôn ngữ trong dịch đa ngữ .......................... 16 Hình . . ịch qua ngôn ngữ trục trong dịch đa ngữ ............................................... 17 Hình . . Mô hình đánh giá dịch trực tiếp và dịch qua ngôn ngữ trung gian ........ 17 Hình . . Biểu diễn câu tiếng Anh sang UNL ........................................................ 28 Hình . . Biểu diễn biểu thức UNL dưới dạng đồ thị ............................................. 29 Hình . . Cơ chế chuyển đổi của hệ thống UNL .................................................... 29 Hình . . Hệ thống UNL14 ...................................................................................... 30 Hình . . Quá trình chuyển đổi dữ liệu trong dự án UNL – EOLSS [15] .............. 33 Hình . . Hệ thống UNL cho các ngôn ngữ ........................................................... 34 Hình . . Dịch qua ngôn ngữ trục UNL.................................................................. 34 Hình . . Mô hình dịch tiếng Việt – UNL ................................................................ 42 Hình . . Sơ đồ chuyển đổi của công cụ EnCoVie ................................................... 43 Hình . . Danh sách các nút trong Node-list ............................................................ 43 Hình . . Sơ đồ liên kết các Headword .................................................................... 44 -v- Hình . . Sơ đồ mã hóa câu tiếng Việt sang UNL .................................................... 44 Hình . . Sơ đồ chuyển đổi của công cụ DeCoVie .................................................. 45 Hình . . Mối quan hệ nhị phân giữa hai từ vựng .................................................... 45 Hình . . Sơ đồ mã hóa biểu thức UNL sang câu tiếng Việt .................................... 46 Hình . . Trạng thái cuối cùng của Node-list ........................................................... 46 Hình . . Sử dụng UW để tìm HeadWord trong quá trình giải mã ........................ 48 Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “+”............................... 51 Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “-” .............................. 52 Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “<”............................... 52 Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “>”............................... 53 Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “:” ................................ 54 Hình . . Luật chèn phải một nút từ Node vào Node-list ....................................... 54 Hình . . Luật chèn trái một nút từ Node vào Node-list ........................................ 55 Hình . . Luật xóa nút phải một nút từ Node-list ................................................... 56 Hình . . Luật xóa nút trái một nút từ Node-list ..................................................... 56 Hình . . Mô-đun xử lý câu tiếng Việt đầu vào [9] ............................................... 58 Hình . . Luật ngữ pháp chuyển đổi tiếng Việt sang biểu thức UNL ...................... 69 Hình . . Đồ thị biểu diễn biểu thức UNL ............................................................... 83 Hình . . Mối tương quan giữa hai ngôn ngữ tiếng Việt và UNL ........................... 83 Hình . . Sắp xếp trật tự các từ câu đầu ra tiếng Việt ............................................. 84 Hình . . Sắp xếp trật tự các từ câu đầu ra tiếng Việt ............................................. 84 Hình . . Đồ thị UNL biểu diễn cho biểu thức có một nút con ............................... 84 Hình . . Đồ thị UNL biểu diễn cho biểu thức có nhiều nút con ............................ 86 -vi- Hình . . Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 1 ............. 88 Hình . . Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 2 ............. 89 Hình . . Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 3 ........... 92 Hình . . Đồ thị biểu diễn biểu thức UNL ............................................................. 100 Hình . . Đồ thị biểu diễn biểu thức UNL chứa một hay nhiều nút con ............... 106 Hình . . Đồ thị biểu diễn biểu thức UNL chứa nút kết hợp ................................. 112 Hình . . Hệ thống dịch đa ngữ dựa vào UNL ...................................................... 118 Hình . . Biểu đồ chất lượng dịch qua UNL và dịch trực tiếp .............................. 120 -vii- ANH MỤC BẢNG Bảng . . Kết quả đánh giá qua tiếng Pháp ............................................................. 19 Bảng . . Kết quả đánh giá qua tiếng Đức ............................................................... 19 Bảng . . Tỷ lệ giống/khác giữa 2 bản dịch máy..................................................... 20 Bảng . . Các quan hệ được định nghĩa trong UNL [66] ......................................... 24 Bảng . . Các thuộc tính được định nghĩa trong UNL [66] ..................................... 25 Bảng . . Mô tả hình thức bảng trong biểu thức UNL [66]...................................... 27 Bảng . . Tỷ lệ giống/khác giữa dịch qua UNL và tiếng Anh ................................. 38 Bảng . . Các mô hình câu đơn [ ] ........................................................................ 40 Bảng . . Tập nhãn từ loại trong từ điển cho tiếng Việt [9] ..................................... 48 Bảng . . Tập nhãn từ loại con trong từ điển cho tiếng Việt [9] .............................. 49 Bảng . . Số mục từ tiếng Việt – UNL thu được với giải pháp thứ nhất ............... 115 Bảng . . Một số ví dụ câu không khớp ở máy chủ tiếng Anh ............................. 118 Bảng . . Tỷ lệ thay đổi giữa dịch qua UNL và trực tiếp ....................................... 119 1 MỞ ĐẦ 1. L chọn ề ài Cùng với sự phát triển của công nghệ, con người đã tạo ra một lượng thông tin khổng lồ trên mạng Internet được cung cấp từ hàng triệu Website trên khắp thế giới. Nhưng chúng ta không thể khai thác hết thông tin bởi nhiều lý do và một trong những lý do quan trọng nhất là rào cản về ngôn ngữ. Vấn đề đặt ra là làm thế nào để mọi người trên thế giới có thể khai thác hết nguồn thông tin trên Internet mà không bị hạn chế bởi ngôn ngữ? Hiện có hai giải pháp chính để giải quyết vấn đề này: thứ nhất là phát triển các hệ thống, các ứng dụng, các nguồn dữ liệu đa ngữ để người sử dụng có thể lựa chọn ngôn ngữ mà họ muốn khi sử dụng; thứ hai là ứng dụng các phần mềm dịch tự động để dịch các giao diện, ... V, C phải V 73. Phải chi V, C cũng V Nhóm 23 74. V, (C cũng V) Nhóm 24 75. Hình như (C-V), (C đều V) Nhóm 25 76. C càng V thì càng V Nhóm 26 77. C càng phải V thì mới V Nhóm 27 78. V là V Nhóm 28 79. Muốn V mà (C-V) thì V Nhóm 29 80. (V nhưng (C-V)) thì V Nhóm 30 81. Nếu (C-V) thì (dẫu V, V) Nhóm 31 82. Nếu V, V CÂ NHÂN NHƯỢNG: Tuy (C –V) nhưng (C – V) Nhóm 1 1. Tuy (C-V) nhưng (C-V) 2. Cho dù (C-V) nhưng (C-V) 3. Mặc dù (C-V) song (C-V) 4. ẫu (C-V) thì (C-V) Nhóm 2 5. Mặc dù V nhưng (C-V) 6. Tuy V nhưng (C-V) Nhóm 3 7. Mặc dù (C-V) (C-V) 8. Dù (C-V) (C-V) Nhóm 4 9. Mặc dù V (C-V) 10. Dù cho V (C-V) 11. ẫu V (C-V) Nhóm 5 12. (C-V) tuy (C-V) 13. (C-V) mặc dù (C-V) Nhóm 6 14. (C-V) tuy V 15. (C-V) dù V 16. (C-V) mặc dù V Nhóm 7 17. Mặc dù/ bởi V (C-V) nhưng (C-V) Nhóm 8 18. C tuy V nhưng V 19. C dù V vẫn V 20. C tuy V mà V 21. C tuy V chớ V Nhóm 9 22. ù V (C cũng V) Nhóm 10 23. C dù V (c cũng V) Nhóm 11 24. ẫu cho (C-V), V 30 25. Cho dù (C-V), V Nhóm 12 26. ẫu vì/ V (C-V) nhưng V Nhóm 13 27. (C-V) mặc dù vì V, (C-V) CÂ MỤC ĐÍCH: (C-V) để (C-V) Nhóm 1 1. (C-V) để (C-V) 2. (C-V) cho (C-V) 3. (C-V) để cho (C-V) 4. (C-V) cốt cho (C-V) 5. (C-V) cốt buộc (C-V) 6. (C-V) hòng buộc (C-V) Nhóm 2 7. Để (C-V) (C-V) 8. Để cho (C-V) (C-V) Nhóm 3 9. V để (C-V) 10. V cho (C-V) Nhóm 4 11. (C-V) (C-V) Nhóm 5 12. V, (C-V) CÂU SO SÁNH: (C-V) như (C-V) Nhóm 1 1. (C-V) như (C-V) 2. (C-V) tựa như (C-V) 3. (C-V) hệt như (C-V) 4. (C-V) giống như (C-V) 5. (C-V) y như (C-V) 6. (C-V) chẳng khác gì (C-V) 7. (C-V) hệt (C-V) Nhóm 2 8. (C-V) hệt như V 9. (C-V) như V 10. (C-V) cũng như V Nhóm 3 11. (C-V) chớ V như (C-V) Nhóm 4 12. Đúng như (C-V) (C-V) 13. Như (C-V) (C-V) Nhóm 5 14. V như (C-V) Nhóm 6 15. (C-V) bao nhiêu thì (C-V) bấy nhiêu CÂ BÌNH ĐẲNG: (C-V) và (C-V) Nhóm 1 1. (C-V) và (C-V) 2. (C-V) rồi (C-V) 3. (C-V) sau đó (C-V) 4. (C-V) đồng thời (C-V) 5. (C-V) với lại (C-V) 31 6. (C-V) với (C-V) 7. (C-V) khi thì (C-V) 8. (C-V) có nghĩa là (C-V) 9. (C-V) cùng với (C-V) 10. (C-V) sau đó (C-V) 11. (C-V) tức là (C-V) 12. (C-V) nói đúng hơn là (C-V) 13. (C-V) ấy thế là (C-V) 14. (C-V) trong đó (C-V) Nhóm 2 15. (C-V) (C-V) Nhóm 3 16. (C-V) và V 17. (C-V) rồi V 18. (C-V) sau đó V 19. (C-V) đồng thời V 20. (C-V) trong đó V Nhóm 4 21. V và (C-V) 22. V rồi (C-V) 23. V, sau đó (C-V) 24. V có nghĩa là (C-V) 25. V làm sao (C-V) Nhóm 5 26. (C-V) đâu, V đó Nhóm 6 27. (C-V) và (vì (C-V) nên V) Nhóm 7 28. (C-V) và (càng V càng V) Nhóm 8 29. (C-V) (vừa V vừa V) 30. (C-V) (tuy V nhưng V) 31. (C-V) (cũng V cũng V) 32. (C-V) (V mà V) Nhóm 9 33. (C-V) V (phải) 34. (C-V) V (có thể) 35. (C-V) V (là) Nhóm 10 36. (C-V), (C-V) mà/nếu (C-V) thì V Nhóm 11 37. (C-V) nhưng (C-V) và (C-V) 38. (C-V) đi (C-V) rồi (C-V) Nhóm 12 39. (C chỉ V) rồi V Nhóm 13 40. (C-V) khi V, (C-V) Nhóm 14 41. (Bên cạnh C chỉ có thể V nếu V), (C-V nếu V) Nhóm 15 42. V rồi V 43. V đồng thời V 32 44. V có nghĩa là V 45. V và V Nhóm 16 46. (C-V), V Nhóm 17 47. V (C-V) Nhóm 18 48. V, V cần phải 49. V, V phải Nhóm 19 50. (C-V) cần phải, (C-V) Nhóm 20 51. C không thể (V mà V), không thể (V mà còn V) CÂ LỰA CHỌN: (C-V) HOẶC (C-V) Nhóm 1 1. (C-V) hoặc (C-V) 2. (C-V) hay (C-V) 3. (C-V) hoặc là (C-V) Nhóm 2 4. (C-V) hoặc V 5. (C-V) hay là V Nhóm 3 6. V hay (C-V) 7. V hoặc (C-V) CÂ TƯƠNG PHẢN: (C-V) nhưng (C-V) Nhóm 1 1. (C-V) nhưng (C-V) 2. (C-V) chứ (C-V) 3. (C-V) vậy mà (C-V) 4. (C-V) ấy vậy mà (C-V) 5. (C-V) còn (C-V) 6. (C-V) không ngờ (C-V) 7. (C-V) ngờ đâu (C-V) 8. (C-V) hơn nữa (C-V) 9. (C-V) chỉ phải cái (C-V) 10. (C-V), ngược lại (C-V) 11. (C-V) trái lại (C-V) 12. (C-V) ngặt nổi (C-V) 13. (C-V) ai ngờ (C-V) 14. (C-V) chỉ có (C-V) 15. (C-V) với lại (C-V) 16. (C-V) song (C-V) 17. (C-V) mà (C-V) Nhóm 2 18. (C-V) chứ V 19. (C-V) thế mà V 20. (C-V) thế tại sao V 21. (C-V) hơn nữa V 33 22. (C-V) lại V 23. (C-V) để rồi V 24. (C-V) chỉ V 25. (C-V) vậy mà V 26. (C-V) mà lại V 27. (C-V) mà còn V 28. (C-V) mà chỉ V 29. (C-V) mà V 30. (C-V) nhưng V 31. (C-V) song V Nhóm 3 32. (C-V) nhưng/ nếu (C-V) thì (C-V) 33. (C-V) nhưng/ vì (C-V) cho nên (C-V) 34. (C-V) nhưng/ nhờ (C-V) mà (C-V) Nhóm 4 35. (C-V) nhưng/ nếu (C-V), (C-V) 36. V nhưng/ khi (C-V), (C-V) Nhóm 5 37. (C-V) lại (V còn V) 38. (C-V) nhưng (V thì V) 39. (C-V) chỉ ( V thì V) 40. (C-V) mà bởi (V nên V) 41. (C-V) mà (khi V thì V) 42. (C-V) lại (V thì V) 43. (C-V) ngặt nổi (V nên V) Nhóm 6 44. V nhưng (C-V) 45. V song (C-V) 46. V chứ (C-V) 47. V mà (C-V) 48. V còn (C-V) 49. V không có (C-V) 50. V ngặt nổi (C-V) Nhóm 7 51. (C-V) nhưng (C-V) vì (C-V) 52. (C-V) ngặt nổi (C-V) nên (C-V) Nhóm 8 53. (C-V) nhưng (vì V (C-V)) Nhóm 9 54. (C-V) nhưng (V vì (C-V)) 55. (C – C) mà chỉ (V mới (C-V)) Nhóm 10 56. V không thôi V 57. V chứ V 58. V không có V 59. V nhưng V 34 60. V mà V 61. V nhưng đồng thời V 62. V lại còn V 63. V lại V Nhóm 11 64. Nếu V thì (C-V) nhưng (C-V) Nhóm 12 65. V song (khi V thì V) Nhóm 13 66. (V thì V), song (nếu V thì V) Nhóm 14 67. (C – vốn V) chứ V 68. (C phải là V) chứ không thể V 69. (C có thể V) mà không cần V 70. (C không phải V) mà V 71. (C không thể chỉ V) mà V 72. (C cứ tưởng V) hóa ra V Nhóm 15 73. (C-V) chứ (nếu (C-V) thì V) Nhóm 16 74. (C-V) nên (C-V) chứ (nếu V thì (C-V)) Nhóm 17 75. (Hễ V thì thì V, (C-V)) chứ (V mà V thì V) Nhóm 18 76. V nên (C-V) chớ (C-V) Nhóm 19 77. (Nếu V thì V) mà (V thì V) Nhóm 20 78. C không phải V mà (C-V) 79. Chưa có V chỉ có (C-V) Nhóm 21 80. V không phải chỉ V mà V Nhóm 22 81. Không phải V mà V 82. Một mặt V, mặt khác V Nhóm 23 83. Chỉ mới V mà (C-V) Nhóm 24 84. V mà/ tại V nên (C-V) Nhóm 25 85. Không phải (C-V) mà V Nhóm 26 86. Không nên V mà phải coi (C-V) Nhóm 27 87. Từ (C-V), thế mà (C-V) Nhóm 28 88. (C-V) (C-V) Nhóm 29 89. (C-V)V Nhóm 30 90. V (C-V) CÂU GHÉP: C không chỉ V mà còn V Nhóm 1 1. C không chỉ V mà còn V 2. C không những V mà còn V 3. C vừa V vừa V 4. C chẳng những V mà còn V Nhóm 2 5. Không phải chỉ (riêng) (C-V) mà (C-V) 6. Chẳng những (C-V) mà (C-V) 35 Nhóm 3 7. Chẳng những (C-V) mà V Nhóm 4 8. (C-V) càng V càng V 9. (C-V) vừa V vừa V Nhóm 5 10. (C-V) (C-V) Nhóm 6 11. Chẳng những V mà còn (C-V) Nhóm 7 12. C càng V, C càng V Nhóm 8 13. V không phải chỉ V mà còn V Nhóm 9 14. Không những V mà còn V Nhóm 10 15. Không phải C chỉ V mà là V Nhóm 11 16. Vừa V, C vừa V 17. Càng V, C càng V 36 Phụ lục G. Mộ số mục ừ ừ iển iếng Việ – UNL và câu mẫu hử nghiệm (Các mục từ được lấy từ kết quả thử nghiệm xây dựng từ điển của luận án) STT MỤC TỪ TRONG TỪ ĐIỂN TIẾNG VIỆT - UNL 1. [kỹ sư]{}“engineer(icl>person>thing)”(n,nt); 2. [tôi]{}“I(icl>person)”(p,pp); 3. [chúng tôi]{}“we(icl>group)”(p,pp); 4. [anh ấy]{}“he(icl>person)”(p,pp); 5. [học sinh]{}“student(icl>university_student>person,obj>knowledge_domain )”(n,nt); 6. [giáo viên]{}“teacher(icl>educator>thing)”(n,nt); 7. [nhà văn]{}“writer(icl>communicator>thing)”(n,nt); 8. [nhà báo]{}“journalist(icl>writer>thing)”(n,nt); 9. [thợ may]{}“tailor(icl>garmentmaker>thing)”(n,nt); 10. [họa sĩ]{}“artist(icl>creator>thing)”(n,nt); 11. [làm việc]{}“ work(icl>do,agt>person,obj>role,ben>volitional_thing)”(v,vs) ; 12. [ngủ]{}“sleep(icl>rest>be,aoj>living_thing)”(v,vs) ; 13. [ngồi]{}“sit(icl>be,aoj>person,plc>thing)”(v,vs) ; 14. [đứng]{}“stand(icl>be_upright>be,aoj>concrete_thing)”(v,vs) ; 15. [nói]{}“say(icl>communicate>do,equ>tell,agt>person,obj>uw,cao>thing,rec>voliti onal_thing)”(v,vi) ; 16. [hát]{}“sing(icl>do,com>music,cob>thing,agt>living_thing,obj>song,rec> living_thing)”(v,vi); 17. [khóc]{}“weep(icl>cry>do,rsn>thing,agt>living_thing)”(v,vi); 18. [gửi]{}“send(icl>direct>do,plt>uw,plf>thing,agt>volitional_thing,obj>thing, rec>thing)”(v,vt); 19. [thư]{}“letter(icl>text>thing)”(n,na); 20. [bưu điện]{}“post(icl>upright>thing)”(n,ng); 21. [văn phòng]{}“office(icl>organization,icl>place,obj>organization)”(n,ng) ; 22. [trồng]{}“grow(icl>develop>do,equ>raise,src>thing,agt>thing,obj>thing, gol>uw)”(v,vt); 23. [hoa]{}“flower(icl>angiosperm>thing)”(v,vt); 24. [trang trại]{}“farm(icl>workplace>thing)”(n,ng); 25. [mua]{}“buy(icl>get>do,cob>thing,src>thing,agt>person,obj>thing)”(v,vt) ; 26. [tài liệu]{}“paper(icl>material>thing)”(n,na); 37 27. [bán]{}“sell(icl>be_on_sale>be,aoj>thing,val>money)”(v,vt); 28. [bắt]{}“force(icl>cause>do,equ>compel,agt>thing,obj>thing,gol>uw)” (v,vt, order); 29. [ăn]{}“eat(icl>consume>do,agt>living_thing,obj>concrete_thing,ins>thing)” (v,vt); 30. [ở]{}“”(e); 31. [đi]{}“go(icl>move>do,plt>place,plf>place,agt>thing)”(v,vt); 32. [chạy]{}“run(icl>go>do,plt>uw,plf>uw,agt>thing)”(v,vt); 33. [khuyên]{}“advise(icl>counsel>do,agt>person,obj>uw,ben>person)”(v,vt, order); 34. [học]{}“learn(icl>acquire>do,src>uw,agt>volitional_thing,obj>thing)”(v,vt) ; 35. [cấm]{}“forbid(icl>prohibit>do,agt>person,obj>uw,rec>person)”(v,vt,order) vie,0,0>; 36. [yêu cầu]{}“request(icl>beg>do,agt>person,obj>uw,rec>person)”(v,vt,order) ; 37. [lỡ]{}“miss(icl>occur,com>fail,cob>thing,obj>thing)”(v,vt,order); 38. [vừa]{}“”(e); 39. [xe buýt]{}“bus(icl>public_transport>thing)”(n,nt); 40. [sẽ]{}“”(e); 41. [đến]{}“come(icl>move>do,plt>place,agt>person)”(v,vt); 42. [muộn]{}“late(icl>how,ant>early)”(a,ap); 43. [tàu]{}“ship(icl>vessel>thing)”(n,nt); 44. [trở thành]{}“become(icl>occur,obj>thing,gol>uw)”(v,vs); 45. [chăm chỉ]{}“studiously(icl>how,com>studious)”(a,ap); 46. [tốt]{}“well(icl>how)”(a,ap); 47. [luật sư]{}“lawyer(icl>professional>thing)”(n,nt); 48. [công bằng]{}“fairly(icl>how,com>fair)”(a,ap); 49. [tạp chí]{}“magazine(icl>press>thing)”(n,nt); 50. [giải trình]{}“explain(icl>do,equ>explicate,agt>volitional_thing,obj>uw, cao >thing,met>thing,rec>thing)”(n,nt); 51. [chuyến bay]{}“flight(icl>air_travel>thing)”(n,nt); 52. [nghe]{}“listen(icl>hear>do,agt>person,obj>thing)”(v,vt); 53. [đọc]{}“read(icl>see>do,agt>person,obj>information)”(v,vt); 54. [viết]{}“write(icl>communicate>do,agt>person,obj>information,cao>thing, ins>thing,rec>person)”(v,vt); 55. [nhảy]{}“dance(icl>move>do,com>grace,agt>person,obj>thing)”(v,vt); 38 56. [xem]{}“watch(icl>do,equ>view,agt>living_thing,obj>thing)”(v,vt); 57. [đỗ]{}“pass(icl>cross>do,via>thing,plt>thing,plf>thing,agt>thing,plc>thing)”(v,vs) ; 58. [học kì]{}“semester(icl>school_term>thing)”(n,na); 59. [có]{}“have(icl>be,equ>possess,obj>thing,aoj>thing)”(v,vs); 60. [tiền]{}“money(icl>medium_of_exchange>thing)”(n,na); 61. [chạy]{}“run(icl>go>do,plt>uw,plf>uw,agt>thing)”(v,vt); 62. [nhanh]{}“fast(icl>adj,ant>slow)”(a,ap); 63. [chiến thắng]{}“win(icl>prize>do,agt>volitional_thing,obj>thing,cag> volitional_thing,scn>thing)”(v,vs); 64. [giải thưởng]{}“prize(icl>gift>thing)”(n,na); 65. [chậm]{}“slow(icl>adj,ant>fast)”(a,ap); 66. [mất]{}“lose(icl>suffer>do,agt>thing,obj>concrete_thing)”(v,vs); 67. [thần tượng]{}“idol(icl>effigy>thing)”(n,na); 68. [tính toán]{}“calculate(icl>rely>be,obj>person,aoj>person,scn>thing)”(v, vt); 69. [cẩn thận]{}“carefully(icl>how,com>careful)”(a,ap); 70. [tiến bộ]{}“ improve(icl>turn>occur,equ>better,obj>thing)”(v,vs); 71. [toán học]{}“math(icl>science>thing,equ>mathematics)”(n,na); CÂ MẪ THỬ NGHIỆM STT TIẾNG VIỆT TIẾNG ANH TIẾNG NGA 1. Tôi là kỹ sư I am an engineer Я инженер 2. Chúng tôi là kỹ sư We are engineers Мы инженеры 3. Anh ấy là kỹ sư He is an engineer Он инженер 4. Tôi là học sinh I am a student Я студент 5. Chúng tôi là học sinh We are students Мы студенты 6. Anh ấy là học sinh He is an student Он студент 7. Tôi làm việc I work Я работаю 8. Chúng tôi làm việc We work Мы работаем 9. Anh ấy làm việc He works Он работает 10. Tôi ngủ I sleep Я сплю 11. Chúng tôi ngủ We sleep Мы спим 12. Anh ấy ngủ He sleeps Он спит 13. Tôi gửi thư ở bưu điện I send a letter at the post Я отправляю письмо в почтовом отделении 14. Chúng tôi gửi thư ở bưu điện We send a letter at the post Мы отправляем письмо в почтовом отделении 39 15. Anh ấy gửi thư ở bưu điện He sends a letter at the post Он отправляет письмо в почтовом отделении 16. Tôi gửi thư ở văn phòng I send a letter at the office Я отправляю письмо в офисе 17. Chúng tôi gửi thư ở văn phòng We send a letter at the office Мы отправляем письмо в офисе 18. Anh ấy gửi thư ở văn phòng he sends a letter at the office Он отправляет письмо в офисе 19. Tôi bắt anh ấy ăn I force him to eat Я заставляю его есть 20. Chúng tôi bắt anh ấy ăn We force him to eat Мы заставляем его есть 21. Anh ấy bắt tôi ăn He forces me to eat Он заставляет меня есть 22. Tôi bắt anh ấy đi I force him to go Я заставляю его идти 23. Chúng tôi bắt anh ấy đi We force him to go Мы заставляем его идти 24. Anh ấy bắt tôi đi He forces me to go Он заставляет меня идти 25. Tôi vừa lỡ xe buýt, tôi sẽ đến muộn I have missed the bus, I will come late Я только что пропустил автобус, я опоздаю 26. Chúng tôi vừa lỡ xe buýt, chúng tôi sẽ đến muộn We have missed the bus, we will come late Мы только что пропустили автобус, мы опоздаем 27. Anh ấy vừa lỡ xe buýt, anh ấy sẽ đến muộn He has missed the bus, he will come late Он только что пропустил автобус, он опоздает 28. Tôi nhảy và anh ấy xem I dance and he watches Я танцую, и он смотрит 29. Chúng tôi nhảy và anh ấy xem we dance and he watches Мы танцуем и он смотрит 30. Nếu anh ấy học chăm chỉ thì anh ấy sẽ đỗ học kì If he learns studiously, he will pass the semester Если он будет усердно учиться, он сдаст экзамены 31. Nếu tôi học chăm chỉ thì tôi sẽ đỗ học kì If I learn studiously, he will pass the semester Если я буду учиться, я cдам экзамены 32. Nếu chúng tôi học chăm chỉ thì chúng tôi sẽ đỗ học kì If we learn studiously, he will pass the semester Если мы будем усердно учиться, мы cдадим экзамены.
File đính kèm:
- luan_an_su_dung_ngon_ngu_truc_trong_dich_da_ngu.pdf