Luận án Sử dụng ngôn ngữ trục trong dịch đa ngữ

Cùng với sự phát triển của công nghệ, con người đã tạo ra một lượng thông

tin khổng lồ trên mạng Internet được cung cấp từ hàng triệu Website trên khắp thế

giới. Nhưng chúng ta không thể khai thác hết thông tin bởi nhiều lý do và một trong

những lý do quan trọng nhất là rào cản về ngôn ngữ. Vấn đề đặt ra là làm thế nào để

mọi người trên thế giới có thể khai thác hết nguồn thông tin trên Internet mà không

bị hạn chế bởi ngôn ngữ? Hiện có hai giải pháp chính để giải quyết vấn đề này: thứ

nhất là phát triển các hệ thống, các ứng dụng, các nguồn dữ liệu đa ngữ để người sử

dụng có thể lựa chọn ngôn ngữ mà họ muốn khi sử dụng; thứ hai là ứng dụng các

phần mềm dịch tự động để dịch các giao diện, nội dung từ ngôn ngữ hiện có sang

ngôn ngữ mà người sử dụng chọn lựa.

Hiện có nhiều hệ thống dịch đa ngữ được xây dựng với nhiều hướng tiếp cận

khác nhau và chất lượng bản dịch ngày càng được cải thiện. Tuy nhiên, đầu ra bản

dịch của các hệ thống này hầu hết chỉ mang tính tham khảo vì chưa thể hiện hết ý

nghĩa, văn phong của câu nguồn. Hơn nữa trên thế giới hiện đang sử dụng hơn

5. ngôn ngữ có chữ viết, việc phát triển một hệ thống dịch đa ngữ cho từng cặp

ngôn ngữ là vô cùng khó khăn và nhất là những ngôn ngữ có số lượng người dùng

ít1. Một trong những hướng tiếp cận mới trong dịch đa ngữ đang được quan tâm là

sử dụng ngôn ngữ trục để dịch, hướng tiếp cận này giảm chi phí xây dựng phần

mềm từ (n*(n-1)) xuống còn (2*n) và giải quyết các cặp ngôn ngữ thiếu tài nguyên

hoặc không tương đồng cấu trúc ngữ pháp [13]

pdf 187 trang dienloan 13780
Bạn đang xem 20 trang mẫu của tài liệu "Luận án Sử dụng ngôn ngữ trục trong dịch đa ngữ", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Luận án Sử dụng ngôn ngữ trục trong dịch đa ngữ

Luận án Sử dụng ngôn ngữ trục trong dịch đa ngữ
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
ĐẠI HỌC ĐÀ NẴNG 
PHAN THỊ LỆ THUYỀN 
SỬ DỤNG NGÔN NGỮ TRỤC TRONG DỊCH ĐA NGỮ 
LUẬN ÁN TIẾN SĨ KỸ THUẬT 
Đà Nẵng 2018 
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
ĐẠI HỌC ĐÀ NẴNG 
PHAN THỊ LỆ THUYỀN 
SỬ DỤNG NGÔN NGỮ TRỤC TRONG DỊCH ĐA NGỮ 
 Chuyên ngành : KHOA HỌC MÁY TÍNH 
 Mã số : 62 48 01 01 
LUẬN ÁN TIẾN SĨ KỸ THUẬT 
 Người hướng dẫn khoa học: PGS.TS. Võ Trung Hùng 
Đà Nẵng 2018 
LỜI CAM ĐOAN 
Tôi cam đoan đây là kết quả nghiên cứu của riêng tôi. Các nội dung và kết 
quả nghiên cứu được trình bày trong Luận án là trung thực và chưa từng được ai 
công bố trong bất kỳ công trình nào khác. 
 Tác giả 
 NCS. Phan Thị Lệ Thuyền 
LỜI CẢM ƠN 
- 
Trước tiên, tác giả xin gửi lời cảm ơn đến Ban Đào tạo - Đại học Đà Nẵng, 
Khoa Công nghệ Thông tin, Phòng Đào tạo Trường Đại học Bách khoa - Đại học 
Đà Nẵng đã tạo điều kiện thuật lợi trong thời gian học tập và nghiên cứu. 
Tác giả muốn tri ân đến các Thầy Cô giáo Khoa Công nghệ Thông tin 
Trường Đại học Bách khoa - Đại học Đà Nẵng, đặc biệt là thầy Võ Trung Hùng đã 
tận tình giúp đỡ tác giả từ những bước đi đầu tiên hình thành ý tưởng, cũng như 
trong suốt quá trình nghiên cứu. Thầy luôn ủng hộ, động viên và tạo điều kiện tốt 
nhất để tác giả hoàn thành luận án. Tác giả nhận thấy sự trưởng thành sau những 
năm được học tập và nghiên cứu dưới sự hướng dẫn của Thầy. 
Tác giả chân thành cảm ơn các chuyên gia, các nhà ngôn ngữ học (PGS.TS 
Nguyễn Ngọc Chinh, TS. Nguyễn Quý Thành) đã dành thời gian để hỗ trợ tác giả 
nghiên cứu về mặt ngôn ngữ học, kiểm tra, đánh giá các kết quả dịch tự động và so 
sánh chất lượng dịch các hệ thống. Sự giúp đỡ của các nhà ngôn ngữ học đã giúp 
ích rất nhiều trong suốt quá trình nghiên cứu và hoàn thành báo cáo luận án này. 
Tác giả xin gửi lời cảm ơn chân thành tới các anh chị NCS của Khoa Công 
nghệ Thông tin Trường Đại học Bách khoa - Đại học Đà Nẵng, những người thân 
và bạn bè luôn bên cạnh động viên, hỗ trợ về mặt tinh thần để tác giả vượt qua khó 
khăn và hoàn thành tốt luận án. 
-i- 
MỤC LỤC 
DANH MỤC HÌNH VẼ ................................................................................................... iv 
DANH MỤC BẢNG ................................................................................................... vii 
MỞ ĐẦU ....................................................................................................................... 1 
Chương 1. TỔNG QUAN VỀ DỊCH MÁY VÀ NGÔN NGỮ UNL ........................ 7 
1.1. Một số khái niệm sử dụng trong luận án ............................................................. 7 
1.2. Một số hướng tiếp cận trong dịch tự động .......................................................... 9 
1.2.1. Dịch máy dựa trên luật .............................................................................. 10 
1.2.2. Dịch máy dựa trên ngữ liệu ....................................................................... 12 
1.2.3. Phương pháp dịch kết hợp ......................................................................... 14 
1.2.4. Đánh giá .................................................................................................... 15 
1.3. Dịch đa ngữ ....................................................................................................... 16 
1.4. Vấn đề dịch tự động cho tiếng Việt................................................................... 20 
1.5. Tổng quan về UNL ............................................................................................ 22 
1.5.1. Giới thiệu ................................................................................................... 22 
1.5.2. Ngôn ngữ UNL ........................................................................................... 22 
1.5.3. Hệ thống UNL ............................................................................................ 29 
1.5.4. Một số kết quả nghiên cứu liên quan ......................................................... 31 
1.5.5. Ứng dụng UNL làm ngôn ngữ trục trong hệ thống dịch đa ngữ ............... 33 
1.6. Tiểu kết chương ................................................................................................. 35 
Chương 2. ĐỀ XUẤT MÔ HÌNH DỊCH TIẾNG VIỆT - UNL ............................. 37 
2.1. Đặt vấn đề .......................................................................................................... 37 
2.2. Ngữ pháp tiếng Việt .......................................................................................... 39 
2.3. Đề xuất mô hình dịch ........................................................................................ 41 
-ii- 
2.3.1. Công cụ EnCoVie ....................................................................................... 42 
2.3.2. Công cụ DeCoVie ...................................................................................... 45 
2.3.3. Từ điển trong UNL ..................................................................................... 46 
2.3.4. Luật ngữ pháp trong UNL ......................................................................... 49 
2.4. Một số vấn đề cần xử lý cho tiếng Việt............................................................. 56 
2.5. Tiểu kết chương ................................................................................................. 58 
Chương 3. GIẢI PHÁP XÂY DỰNG TỪ ĐIỂN VÀ LUẬT .................................. 60 
3.1. Giải pháp xây dựng từ điển tiếng Việt - UNL................................................... 60 
3.2. Giải pháp xây dựng luật ngữ pháp .................................................................... 69 
3.2.1. Xây dựng luật mã hóa ................................................................................ 69 
3.2.2. Xây dựng luật giải mã ................................................................................ 83 
3.3. Tiểu kết chương ................................................................................................. 94 
Chương 4. THỬ NGHIỆM VÀ ĐÁNH GIÁ ............................................................ 96 
4.1. Xây dựng công cụ EnCoVie và DeCoVie ......................................................... 96 
4.1.1. Xây dựng công cụ EnCoVie ....................................................................... 96 
4.1.2. Xây dựng công cụ DeCoVie ....................................................................... 99 
4.2. Thử nghiệm và đánh giá .................................................................................. 114 
4.2.1. Từ điển tiếng Việt – UNL ......................................................................... 114 
4.2.2. Dịch đa ngữ qua ngôn ngữ trục UNL ...................................................... 115 
4.3. Tiểu kết chương ............................................................................................... 122 
KẾT L ẬN ............................................................................................................... 123 
TÀI LIỆ THAM KHẢO ....................................................................................... 128 
PHỤ LỤC .................................................................................................................. 137 
-iii- 
 ANH MỤC CÁC TỪ VIẾT T T 
LGW Left Generation Window Cửa sổ tạo ra bên trái 
LW Left Window Cửa sổ trái 
RGW Right Generation Window Cửa sổ tạo ra bên phải 
RW Right Window Cửa sổ phải 
 UNL Universal Networking Language Ngôn ngữ mạng dùng chung 
UNLKB Universal Networking Language Cơ sở tri thức của ngôn ngữ 
 Knowledge Base mạng dùng chung 
UW Universal Word Từ vựng chung 
-iv- 
 ANH MỤC HÌNH VẼ 
Hình . . Sơ đồ hệ thống dịch trực tiếp [13]............................................................. 11 
Hình . . Sơ đồ hệ thống dịch chuyển đổi [13] ........................................................ 11 
Hình . . Sơ đồ hệ thống dịch qua ngôn ngữ trung gian [13]................................... 12 
Hình . . Sơ đồ hệ thống dịch dựa trên ví dụ [13] .................................................... 13 
Hình . . Sơ đồ hệ thống dịch dựa trên thống kê [13] .............................................. 14 
Hình . . Kết hợp phương pháp dịch dựa trên luật và thống kê [13] ....................... 14 
Hình . . Mô hình dịch máy dựa trên luật ................................................................ 15 
Hình . . Dịch trực tiếp giữa các cặp ngôn ngữ trong dịch đa ngữ .......................... 16 
Hình . . ịch qua ngôn ngữ trục trong dịch đa ngữ ............................................... 17 
Hình . . Mô hình đánh giá dịch trực tiếp và dịch qua ngôn ngữ trung gian ........ 17 
Hình . . Biểu diễn câu tiếng Anh sang UNL ........................................................ 28 
Hình . . Biểu diễn biểu thức UNL dưới dạng đồ thị ............................................. 29 
Hình . . Cơ chế chuyển đổi của hệ thống UNL .................................................... 29 
Hình . . Hệ thống UNL14 ...................................................................................... 30 
Hình . . Quá trình chuyển đổi dữ liệu trong dự án UNL – EOLSS [15] .............. 33 
Hình . . Hệ thống UNL cho các ngôn ngữ ........................................................... 34 
Hình . . Dịch qua ngôn ngữ trục UNL.................................................................. 34 
Hình . . Mô hình dịch tiếng Việt – UNL ................................................................ 42 
Hình . . Sơ đồ chuyển đổi của công cụ EnCoVie ................................................... 43 
Hình . . Danh sách các nút trong Node-list ............................................................ 43 
Hình . . Sơ đồ liên kết các Headword .................................................................... 44 
-v- 
Hình . . Sơ đồ mã hóa câu tiếng Việt sang UNL .................................................... 44 
Hình . . Sơ đồ chuyển đổi của công cụ DeCoVie .................................................. 45 
Hình . . Mối quan hệ nhị phân giữa hai từ vựng .................................................... 45 
Hình . . Sơ đồ mã hóa biểu thức UNL sang câu tiếng Việt .................................... 46 
Hình . . Trạng thái cuối cùng của Node-list ........................................................... 46 
Hình . . Sử dụng UW để tìm HeadWord trong quá trình giải mã ........................ 48 
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “+”............................... 51 
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “-” .............................. 52 
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “<”............................... 52 
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “>”............................... 53 
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “:” ................................ 54 
Hình . . Luật chèn phải một nút từ Node vào Node-list ....................................... 54 
Hình . . Luật chèn trái một nút từ Node vào Node-list ........................................ 55 
Hình . . Luật xóa nút phải một nút từ Node-list ................................................... 56 
Hình . . Luật xóa nút trái một nút từ Node-list ..................................................... 56 
Hình . . Mô-đun xử lý câu tiếng Việt đầu vào [9] ............................................... 58 
Hình . . Luật ngữ pháp chuyển đổi tiếng Việt sang biểu thức UNL ...................... 69 
Hình . . Đồ thị biểu diễn biểu thức UNL ............................................................... 83 
Hình . . Mối tương quan giữa hai ngôn ngữ tiếng Việt và UNL ........................... 83 
Hình . . Sắp xếp trật tự các từ câu đầu ra tiếng Việt ............................................. 84 
Hình . . Sắp xếp trật tự các từ câu đầu ra tiếng Việt ............................................. 84 
Hình . . Đồ thị UNL biểu diễn cho biểu thức có một nút con ............................... 84 
Hình . . Đồ thị UNL biểu diễn cho biểu thức có nhiều nút con ............................ 86 
-vi- 
Hình . . Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 1 ............. 88 
Hình . . Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 2 ............. 89 
Hình . . Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 3 ........... 92 
Hình . . Đồ thị biểu diễn biểu thức UNL ............................................................. 100 
Hình . . Đồ thị biểu diễn biểu thức UNL chứa một hay nhiều nút con ............... 106 
Hình . . Đồ thị biểu diễn biểu thức UNL chứa nút kết hợp ................................. 112 
Hình . . Hệ thống dịch đa ngữ dựa vào UNL ...................................................... 118 
Hình . . Biểu đồ chất lượng dịch qua UNL và dịch trực tiếp .............................. 120 
-vii- 
 ANH MỤC BẢNG 
Bảng . . Kết quả đánh giá qua tiếng Pháp ............................................................. 19 
Bảng . . Kết quả đánh giá qua tiếng Đức ............................................................... 19 
Bảng . . Tỷ lệ giống/khác giữa 2 bản dịch máy..................................................... 20 
Bảng . . Các quan hệ được định nghĩa trong UNL [66] ......................................... 24 
Bảng . . Các thuộc tính được định nghĩa trong UNL [66] ..................................... 25 
Bảng . . Mô tả hình thức bảng trong biểu thức UNL [66]...................................... 27 
Bảng . . Tỷ lệ giống/khác giữa dịch qua UNL và tiếng Anh ................................. 38 
Bảng . . Các mô hình câu đơn [ ] ........................................................................ 40 
Bảng . . Tập nhãn từ loại trong từ điển cho tiếng Việt [9] ..................................... 48 
Bảng . . Tập nhãn từ loại con trong từ điển cho tiếng Việt [9] .............................. 49 
Bảng . . Số mục từ tiếng Việt – UNL thu được với giải pháp thứ nhất ............... 115 
Bảng . . Một số ví dụ câu không khớp ở máy chủ tiếng Anh ............................. 118 
Bảng . . Tỷ lệ thay đổi giữa dịch qua UNL và trực tiếp ....................................... 119 
1 
MỞ ĐẦ 
1. L chọn ề ài 
Cùng với sự phát triển của công nghệ, con người đã tạo ra một lượng thông 
tin khổng lồ trên mạng Internet được cung cấp từ hàng triệu Website trên khắp thế 
giới. Nhưng chúng ta không thể khai thác hết thông tin bởi nhiều lý do và một trong 
những lý do quan trọng nhất là rào cản về ngôn ngữ. Vấn đề đặt ra là làm thế nào để 
mọi người trên thế giới có thể khai thác hết nguồn thông tin trên Internet mà không 
bị hạn chế bởi ngôn ngữ? Hiện có hai giải pháp chính để giải quyết vấn đề này: thứ 
nhất là phát triển các hệ thống, các ứng dụng, các nguồn dữ liệu đa ngữ để người sử 
dụng có thể lựa chọn ngôn ngữ mà họ muốn khi sử dụng; thứ hai là ứng dụng các 
phần mềm dịch tự động để dịch các giao diện, ... V, C phải V 
73. Phải chi V, C cũng V 
Nhóm 23 74. V, (C cũng V) 
Nhóm 24 75. Hình như (C-V), (C đều V) 
Nhóm 25 76. C càng V thì càng V 
Nhóm 26 77. C càng phải V thì mới V 
Nhóm 27 78. V là V 
Nhóm 28 79. Muốn V mà (C-V) thì V 
Nhóm 29 80. (V nhưng (C-V)) thì V 
Nhóm 30 81. Nếu (C-V) thì (dẫu V, V) 
Nhóm 31 82. Nếu V, V 
CÂ NHÂN NHƯỢNG: Tuy (C –V) nhưng (C – V) 
Nhóm 1 1. Tuy (C-V) nhưng (C-V) 
2. Cho dù (C-V) nhưng (C-V) 
3. Mặc dù (C-V) song (C-V) 
4. ẫu (C-V) thì (C-V) 
Nhóm 2 5. Mặc dù V nhưng (C-V) 
6. Tuy V nhưng (C-V) 
Nhóm 3 7. Mặc dù (C-V) (C-V) 
8. Dù (C-V) (C-V) 
Nhóm 4 9. Mặc dù V (C-V) 
10. Dù cho V (C-V) 
11. ẫu V (C-V) 
Nhóm 5 12. (C-V) tuy (C-V) 
13. (C-V) mặc dù (C-V) 
Nhóm 6 14. (C-V) tuy V 
15. (C-V) dù V 
16. (C-V) mặc dù V 
Nhóm 7 17. Mặc dù/ bởi V (C-V) nhưng (C-V) 
Nhóm 8 18. C tuy V nhưng V 
19. C dù V vẫn V 
20. C tuy V mà V 
21. C tuy V chớ V 
Nhóm 9 22. ù V (C cũng V) 
Nhóm 10 23. C dù V (c cũng V) 
Nhóm 11 24. ẫu cho (C-V), V 
 30 
25. Cho dù (C-V), V 
Nhóm 12 26. ẫu vì/ V (C-V) nhưng V 
Nhóm 13 27. (C-V) mặc dù vì V, (C-V) 
CÂ MỤC ĐÍCH: (C-V) để (C-V) 
Nhóm 1 1. (C-V) để (C-V) 
2. (C-V) cho (C-V) 
3. (C-V) để cho (C-V) 
4. (C-V) cốt cho (C-V) 
5. (C-V) cốt buộc (C-V) 
6. (C-V) hòng buộc (C-V) 
Nhóm 2 7. Để (C-V) (C-V) 
8. Để cho (C-V) (C-V) 
Nhóm 3 9. V để (C-V) 
10. V cho (C-V) 
Nhóm 4 11. (C-V) (C-V) 
Nhóm 5 12. V, (C-V) 
CÂU SO SÁNH: (C-V) như (C-V) 
Nhóm 1 1. (C-V) như (C-V) 
2. (C-V) tựa như (C-V) 
3. (C-V) hệt như (C-V) 
4. (C-V) giống như (C-V) 
5. (C-V) y như (C-V) 
6. (C-V) chẳng khác gì (C-V) 
7. (C-V) hệt (C-V) 
Nhóm 2 8. (C-V) hệt như V 
9. (C-V) như V 
10. (C-V) cũng như V 
Nhóm 3 11. (C-V) chớ V như (C-V) 
Nhóm 4 12. Đúng như (C-V) (C-V) 
13. Như (C-V) (C-V) 
Nhóm 5 14. V như (C-V) 
Nhóm 6 15. (C-V) bao nhiêu thì (C-V) bấy nhiêu 
CÂ BÌNH ĐẲNG: (C-V) và (C-V) 
Nhóm 1 1. (C-V) và (C-V) 
2. (C-V) rồi (C-V) 
3. (C-V) sau đó (C-V) 
4. (C-V) đồng thời (C-V) 
5. (C-V) với lại (C-V) 
 31 
6. (C-V) với (C-V) 
7. (C-V) khi thì (C-V) 
8. (C-V) có nghĩa là (C-V) 
9. (C-V) cùng với (C-V) 
10. (C-V) sau đó (C-V) 
11. (C-V) tức là (C-V) 
12. (C-V) nói đúng hơn là (C-V) 
13. (C-V) ấy thế là (C-V) 
14. (C-V) trong đó (C-V) 
Nhóm 2 15. (C-V) (C-V) 
Nhóm 3 16. (C-V) và V 
17. (C-V) rồi V 
18. (C-V) sau đó V 
19. (C-V) đồng thời V 
20. (C-V) trong đó V 
Nhóm 4 21. V và (C-V) 
22. V rồi (C-V) 
23. V, sau đó (C-V) 
24. V có nghĩa là (C-V) 
25. V làm sao (C-V) 
Nhóm 5 26. (C-V) đâu, V đó 
Nhóm 6 27. (C-V) và (vì (C-V) nên V) 
Nhóm 7 28. (C-V) và (càng V càng V) 
Nhóm 8 29. (C-V) (vừa V vừa V) 
30. (C-V) (tuy V nhưng V) 
31. (C-V) (cũng V cũng V) 
32. (C-V) (V mà V) 
Nhóm 9 33. (C-V) V (phải) 
34. (C-V) V (có thể) 
35. (C-V) V (là) 
Nhóm 10 36. (C-V), (C-V) mà/nếu (C-V) thì V 
Nhóm 11 37. (C-V) nhưng (C-V) và (C-V) 
38. (C-V) đi (C-V) rồi (C-V) 
Nhóm 12 39. (C chỉ V) rồi V 
Nhóm 13 40. (C-V) khi V, (C-V) 
Nhóm 14 41. (Bên cạnh C chỉ có thể V nếu V), (C-V nếu V) 
Nhóm 15 42. V rồi V 
43. V đồng thời V 
 32 
44. V có nghĩa là V 
45. V và V 
Nhóm 16 46. (C-V), V 
Nhóm 17 47. V (C-V) 
Nhóm 18 48. V, V cần phải 
49. V, V phải 
Nhóm 19 50. (C-V) cần phải, (C-V) 
Nhóm 20 51. C không thể (V mà V), không thể (V mà còn V) 
CÂ LỰA CHỌN: (C-V) HOẶC (C-V) 
Nhóm 1 1. (C-V) hoặc (C-V) 
2. (C-V) hay (C-V) 
3. (C-V) hoặc là (C-V) 
Nhóm 2 4. (C-V) hoặc V 
5. (C-V) hay là V 
Nhóm 3 6. V hay (C-V) 
7. V hoặc (C-V) 
CÂ TƯƠNG PHẢN: (C-V) nhưng (C-V) 
Nhóm 1 1. (C-V) nhưng (C-V) 
2. (C-V) chứ (C-V) 
3. (C-V) vậy mà (C-V) 
4. (C-V) ấy vậy mà (C-V) 
5. (C-V) còn (C-V) 
6. (C-V) không ngờ (C-V) 
7. (C-V) ngờ đâu (C-V) 
8. (C-V) hơn nữa (C-V) 
9. (C-V) chỉ phải cái (C-V) 
10. (C-V), ngược lại (C-V) 
11. (C-V) trái lại (C-V) 
12. (C-V) ngặt nổi (C-V) 
13. (C-V) ai ngờ (C-V) 
14. (C-V) chỉ có (C-V) 
15. (C-V) với lại (C-V) 
16. (C-V) song (C-V) 
17. (C-V) mà (C-V) 
Nhóm 2 18. (C-V) chứ V 
19. (C-V) thế mà V 
20. (C-V) thế tại sao V 
21. (C-V) hơn nữa V 
 33 
22. (C-V) lại V 
23. (C-V) để rồi V 
24. (C-V) chỉ V 
25. (C-V) vậy mà V 
26. (C-V) mà lại V 
27. (C-V) mà còn V 
28. (C-V) mà chỉ V 
29. (C-V) mà V 
30. (C-V) nhưng V 
31. (C-V) song V 
Nhóm 3 32. (C-V) nhưng/ nếu (C-V) thì (C-V) 
33. (C-V) nhưng/ vì (C-V) cho nên (C-V) 
34. (C-V) nhưng/ nhờ (C-V) mà (C-V) 
Nhóm 4 35. (C-V) nhưng/ nếu (C-V), (C-V) 
36. V nhưng/ khi (C-V), (C-V) 
Nhóm 5 37. (C-V) lại (V còn V) 
38. (C-V) nhưng (V thì V) 
39. (C-V) chỉ ( V thì V) 
40. (C-V) mà bởi (V nên V) 
41. (C-V) mà (khi V thì V) 
42. (C-V) lại (V thì V) 
43. (C-V) ngặt nổi (V nên V) 
Nhóm 6 44. V nhưng (C-V) 
45. V song (C-V) 
46. V chứ (C-V) 
47. V mà (C-V) 
48. V còn (C-V) 
49. V không có (C-V) 
50. V ngặt nổi (C-V) 
Nhóm 7 51. (C-V) nhưng (C-V) vì (C-V) 
52. (C-V) ngặt nổi (C-V) nên (C-V) 
Nhóm 8 53. (C-V) nhưng (vì V (C-V)) 
Nhóm 9 54. (C-V) nhưng (V vì (C-V)) 
55. (C – C) mà chỉ (V mới (C-V)) 
Nhóm 10 56. V không thôi V 
57. V chứ V 
58. V không có V 
59. V nhưng V 
 34 
60. V mà V 
61. V nhưng đồng thời V 
62. V lại còn V 
63. V lại V 
Nhóm 11 64. Nếu V thì (C-V) nhưng (C-V) 
Nhóm 12 65. V song (khi V thì V) 
Nhóm 13 66. (V thì V), song (nếu V thì V) 
Nhóm 14 67. (C – vốn V) chứ V 
68. (C phải là V) chứ không thể V 
69. (C có thể V) mà không cần V 
70. (C không phải V) mà V 
71. (C không thể chỉ V) mà V 
72. (C cứ tưởng V) hóa ra V 
Nhóm 15 73. (C-V) chứ (nếu (C-V) thì V) 
Nhóm 16 74. (C-V) nên (C-V) chứ (nếu V thì (C-V)) 
Nhóm 17 75. (Hễ V thì thì V, (C-V)) chứ (V mà V thì V) 
Nhóm 18 76. V nên (C-V) chớ (C-V) 
Nhóm 19 77. (Nếu V thì V) mà (V thì V) 
Nhóm 20 
78. C không phải V mà (C-V) 
79. Chưa có V chỉ có (C-V) 
Nhóm 21 80. V không phải chỉ V mà V 
Nhóm 22 
81. Không phải V mà V 
82. Một mặt V, mặt khác V 
Nhóm 23 83. Chỉ mới V mà (C-V) 
Nhóm 24 84. V mà/ tại V nên (C-V) 
Nhóm 25 85. Không phải (C-V) mà V 
Nhóm 26 86. Không nên V mà phải coi (C-V) 
Nhóm 27 87. Từ (C-V), thế mà (C-V) 
Nhóm 28 88. (C-V) (C-V) 
Nhóm 29 89. (C-V)V 
Nhóm 30 90. V (C-V) 
CÂU GHÉP: C không chỉ V mà còn V 
Nhóm 1 1. C không chỉ V mà còn V 
2. C không những V mà còn V 
3. C vừa V vừa V 
4. C chẳng những V mà còn V 
Nhóm 2 
5. Không phải chỉ (riêng) (C-V) mà (C-V) 
6. Chẳng những (C-V) mà (C-V) 
 35 
Nhóm 3 7. Chẳng những (C-V) mà V 
Nhóm 4 
8. (C-V) càng V càng V 
9. (C-V) vừa V vừa V 
Nhóm 5 10. (C-V) (C-V) 
Nhóm 6 11. Chẳng những V mà còn (C-V) 
Nhóm 7 12. C càng V, C càng V 
Nhóm 8 13. V không phải chỉ V mà còn V 
Nhóm 9 14. Không những V mà còn V 
Nhóm 10 15. Không phải C chỉ V mà là V 
Nhóm 11 
16. Vừa V, C vừa V 
17. Càng V, C càng V 
 36 
Phụ lục G. Mộ số mục ừ ừ iển iếng Việ – UNL và câu mẫu hử nghiệm 
(Các mục từ được lấy từ kết quả thử nghiệm xây dựng từ điển của luận án) 
STT MỤC TỪ TRONG TỪ ĐIỂN TIẾNG VIỆT - UNL 
1. [kỹ sư]{}“engineer(icl>person>thing)”(n,nt); 
2. [tôi]{}“I(icl>person)”(p,pp); 
3. [chúng tôi]{}“we(icl>group)”(p,pp); 
4. [anh ấy]{}“he(icl>person)”(p,pp); 
5. [học sinh]{}“student(icl>university_student>person,obj>knowledge_domain 
)”(n,nt); 
6. [giáo viên]{}“teacher(icl>educator>thing)”(n,nt); 
7. [nhà văn]{}“writer(icl>communicator>thing)”(n,nt); 
8. [nhà báo]{}“journalist(icl>writer>thing)”(n,nt); 
9. [thợ may]{}“tailor(icl>garmentmaker>thing)”(n,nt); 
10. [họa sĩ]{}“artist(icl>creator>thing)”(n,nt); 
11. [làm việc]{}“ work(icl>do,agt>person,obj>role,ben>volitional_thing)”(v,vs) 
; 
12. [ngủ]{}“sleep(icl>rest>be,aoj>living_thing)”(v,vs) ; 
13. [ngồi]{}“sit(icl>be,aoj>person,plc>thing)”(v,vs) ; 
14. [đứng]{}“stand(icl>be_upright>be,aoj>concrete_thing)”(v,vs) ; 
15. [nói]{}“say(icl>communicate>do,equ>tell,agt>person,obj>uw,cao>thing,rec>voliti
onal_thing)”(v,vi) ; 
16. [hát]{}“sing(icl>do,com>music,cob>thing,agt>living_thing,obj>song,rec> 
living_thing)”(v,vi); 
17. [khóc]{}“weep(icl>cry>do,rsn>thing,agt>living_thing)”(v,vi); 
18. [gửi]{}“send(icl>direct>do,plt>uw,plf>thing,agt>volitional_thing,obj>thing, 
rec>thing)”(v,vt); 
19. [thư]{}“letter(icl>text>thing)”(n,na); 
20. [bưu điện]{}“post(icl>upright>thing)”(n,ng); 
21. [văn phòng]{}“office(icl>organization,icl>place,obj>organization)”(n,ng) 
; 
22. [trồng]{}“grow(icl>develop>do,equ>raise,src>thing,agt>thing,obj>thing, 
gol>uw)”(v,vt); 
23. [hoa]{}“flower(icl>angiosperm>thing)”(v,vt); 
24. [trang trại]{}“farm(icl>workplace>thing)”(n,ng); 
25. [mua]{}“buy(icl>get>do,cob>thing,src>thing,agt>person,obj>thing)”(v,vt) 
; 
26. [tài liệu]{}“paper(icl>material>thing)”(n,na); 
 37 
27. [bán]{}“sell(icl>be_on_sale>be,aoj>thing,val>money)”(v,vt); 
28. [bắt]{}“force(icl>cause>do,equ>compel,agt>thing,obj>thing,gol>uw)” (v,vt, 
order); 
29. [ăn]{}“eat(icl>consume>do,agt>living_thing,obj>concrete_thing,ins>thing)” 
(v,vt); 
30. [ở]{}“”(e); 
31. [đi]{}“go(icl>move>do,plt>place,plf>place,agt>thing)”(v,vt); 
32. [chạy]{}“run(icl>go>do,plt>uw,plf>uw,agt>thing)”(v,vt); 
33. [khuyên]{}“advise(icl>counsel>do,agt>person,obj>uw,ben>person)”(v,vt, 
order); 
34. [học]{}“learn(icl>acquire>do,src>uw,agt>volitional_thing,obj>thing)”(v,vt) 
; 
35. [cấm]{}“forbid(icl>prohibit>do,agt>person,obj>uw,rec>person)”(v,vt,order) 
vie,0,0>; 
36. [yêu cầu]{}“request(icl>beg>do,agt>person,obj>uw,rec>person)”(v,vt,order) 
; 
37. [lỡ]{}“miss(icl>occur,com>fail,cob>thing,obj>thing)”(v,vt,order); 
38. [vừa]{}“”(e); 
39. [xe buýt]{}“bus(icl>public_transport>thing)”(n,nt); 
40. [sẽ]{}“”(e); 
41. [đến]{}“come(icl>move>do,plt>place,agt>person)”(v,vt); 
42. [muộn]{}“late(icl>how,ant>early)”(a,ap); 
43. [tàu]{}“ship(icl>vessel>thing)”(n,nt); 
44. [trở thành]{}“become(icl>occur,obj>thing,gol>uw)”(v,vs); 
45. [chăm chỉ]{}“studiously(icl>how,com>studious)”(a,ap); 
46. [tốt]{}“well(icl>how)”(a,ap); 
47. [luật sư]{}“lawyer(icl>professional>thing)”(n,nt); 
48. [công bằng]{}“fairly(icl>how,com>fair)”(a,ap); 
49. [tạp chí]{}“magazine(icl>press>thing)”(n,nt); 
50. [giải trình]{}“explain(icl>do,equ>explicate,agt>volitional_thing,obj>uw, cao 
>thing,met>thing,rec>thing)”(n,nt); 
51. [chuyến bay]{}“flight(icl>air_travel>thing)”(n,nt); 
52. [nghe]{}“listen(icl>hear>do,agt>person,obj>thing)”(v,vt); 
53. [đọc]{}“read(icl>see>do,agt>person,obj>information)”(v,vt); 
54. [viết]{}“write(icl>communicate>do,agt>person,obj>information,cao>thing, 
ins>thing,rec>person)”(v,vt); 
55. [nhảy]{}“dance(icl>move>do,com>grace,agt>person,obj>thing)”(v,vt); 
 38 
56. [xem]{}“watch(icl>do,equ>view,agt>living_thing,obj>thing)”(v,vt); 
57. [đỗ]{}“pass(icl>cross>do,via>thing,plt>thing,plf>thing,agt>thing,plc>thing)”(v,vs)
; 
58. [học kì]{}“semester(icl>school_term>thing)”(n,na); 
59. [có]{}“have(icl>be,equ>possess,obj>thing,aoj>thing)”(v,vs); 
60. [tiền]{}“money(icl>medium_of_exchange>thing)”(n,na); 
61. [chạy]{}“run(icl>go>do,plt>uw,plf>uw,agt>thing)”(v,vt); 
62. [nhanh]{}“fast(icl>adj,ant>slow)”(a,ap); 
63. [chiến thắng]{}“win(icl>prize>do,agt>volitional_thing,obj>thing,cag> 
volitional_thing,scn>thing)”(v,vs); 
64. [giải thưởng]{}“prize(icl>gift>thing)”(n,na); 
65. [chậm]{}“slow(icl>adj,ant>fast)”(a,ap); 
66. [mất]{}“lose(icl>suffer>do,agt>thing,obj>concrete_thing)”(v,vs); 
67. [thần tượng]{}“idol(icl>effigy>thing)”(n,na); 
68. [tính toán]{}“calculate(icl>rely>be,obj>person,aoj>person,scn>thing)”(v, 
vt); 
69. [cẩn thận]{}“carefully(icl>how,com>careful)”(a,ap); 
70. [tiến bộ]{}“ improve(icl>turn>occur,equ>better,obj>thing)”(v,vs); 
71. [toán học]{}“math(icl>science>thing,equ>mathematics)”(n,na); 
CÂ MẪ THỬ NGHIỆM 
STT TIẾNG VIỆT TIẾNG ANH TIẾNG NGA 
1. Tôi là kỹ sư I am an engineer Я инженер 
2. Chúng tôi là kỹ sư We are engineers Мы инженеры 
3. Anh ấy là kỹ sư He is an engineer Он инженер 
4. Tôi là học sinh I am a student Я студент 
5. Chúng tôi là học sinh We are students Мы студенты 
6. Anh ấy là học sinh He is an student Он студент 
7. Tôi làm việc I work Я работаю 
8. Chúng tôi làm việc We work Мы работаем 
9. Anh ấy làm việc He works Он работает 
10. Tôi ngủ I sleep Я сплю 
11. Chúng tôi ngủ We sleep Мы спим 
12. Anh ấy ngủ He sleeps Он спит 
13. Tôi gửi thư ở bưu 
điện 
I send a letter at the post Я отправляю письмо в 
почтовом отделении 
14. Chúng tôi gửi thư ở 
bưu điện 
We send a letter at the post Мы отправляем письмо в 
почтовом отделении 
 39 
15. Anh ấy gửi thư ở bưu 
điện 
He sends a letter at the 
post 
Он отправляет письмо в 
почтовом отделении 
16. Tôi gửi thư ở văn 
phòng 
I send a letter at the office Я отправляю письмо в 
офисе 
17. Chúng tôi gửi thư ở 
văn phòng 
We send a letter at the 
office 
Мы отправляем письмо в 
офисе 
18. Anh ấy gửi thư ở văn 
phòng 
he sends a letter at the 
office 
Он отправляет письмо в 
офисе 
19. Tôi bắt anh ấy ăn I force him to eat Я заставляю его есть 
20. Chúng tôi bắt anh ấy 
ăn 
We force him to eat Мы заставляем его есть 
21. Anh ấy bắt tôi ăn He forces me to eat Он заставляет меня есть 
22. Tôi bắt anh ấy đi I force him to go Я заставляю его идти 
23. Chúng tôi bắt anh ấy 
đi 
We force him to go Мы заставляем его идти 
24. Anh ấy bắt tôi đi He forces me to go Он заставляет меня идти 
25. Tôi vừa lỡ xe buýt, tôi 
sẽ đến muộn 
I have missed the bus, I 
will come late 
Я только что пропустил 
автобус, я опоздаю 
26. Chúng tôi vừa lỡ xe 
buýt, chúng tôi sẽ đến 
muộn 
We have missed the bus, 
we will come late 
Мы только что пропустили 
автобус, мы опоздаем 
27. Anh ấy vừa lỡ xe 
buýt, anh ấy sẽ đến 
muộn 
He has missed the bus, he 
will come late 
Он только что пропустил 
автобус, он опоздает 
28. Tôi nhảy và anh ấy 
xem 
I dance and he watches Я танцую, и он смотрит 
29. Chúng tôi nhảy và 
anh ấy xem 
we dance and he watches Мы танцуем и он смотрит 
30. Nếu anh ấy học chăm 
chỉ thì anh ấy sẽ đỗ 
học kì 
If he learns studiously, he 
will pass the semester 
Если он будет усердно 
учиться, он сдаст экзамены 
31. Nếu tôi học chăm chỉ 
thì tôi sẽ đỗ học kì 
If I learn studiously, he 
will pass the semester 
Если я буду учиться, я cдам 
экзамены 
32. Nếu chúng tôi học 
chăm chỉ thì chúng tôi 
sẽ đỗ học kì 
If we learn studiously, he 
will pass the semester 
Если мы будем усердно 
учиться, мы cдадим 
экзамены. 

File đính kèm:

  • pdfluan_an_su_dung_ngon_ngu_truc_trong_dich_da_ngu.pdf