Luận án Sử dụng ngôn ngữ trục trong dịch đa ngữ
Cùng với sự phát triển của công nghệ, con người đã tạo ra một lượng thông
tin khổng lồ trên mạng Internet được cung cấp từ hàng triệu Website trên khắp thế
giới. Nhưng chúng ta không thể khai thác hết thông tin bởi nhiều lý do và một trong
những lý do quan trọng nhất là rào cản về ngôn ngữ. Vấn đề đặt ra là làm thế nào để
mọi người trên thế giới có thể khai thác hết nguồn thông tin trên Internet mà không
bị hạn chế bởi ngôn ngữ? Hiện có hai giải pháp chính để giải quyết vấn đề này: thứ
nhất là phát triển các hệ thống, các ứng dụng, các nguồn dữ liệu đa ngữ để người sử
dụng có thể lựa chọn ngôn ngữ mà họ muốn khi sử dụng; thứ hai là ứng dụng các
phần mềm dịch tự động để dịch các giao diện, nội dung từ ngôn ngữ hiện có sang
ngôn ngữ mà người sử dụng chọn lựa.
Hiện có nhiều hệ thống dịch đa ngữ được xây dựng với nhiều hướng tiếp cận
khác nhau và chất lượng bản dịch ngày càng được cải thiện. Tuy nhiên, đầu ra bản
dịch của các hệ thống này hầu hết chỉ mang tính tham khảo vì chưa thể hiện hết ý
nghĩa, văn phong của câu nguồn. Hơn nữa trên thế giới hiện đang sử dụng hơn
5. ngôn ngữ có chữ viết, việc phát triển một hệ thống dịch đa ngữ cho từng cặp
ngôn ngữ là vô cùng khó khăn và nhất là những ngôn ngữ có số lượng người dùng
ít1. Một trong những hướng tiếp cận mới trong dịch đa ngữ đang được quan tâm là
sử dụng ngôn ngữ trục để dịch, hướng tiếp cận này giảm chi phí xây dựng phần
mềm từ (n*(n-1)) xuống còn (2*n) và giải quyết các cặp ngôn ngữ thiếu tài nguyên
hoặc không tương đồng cấu trúc ngữ pháp [13]
Tóm tắt nội dung tài liệu: Luận án Sử dụng ngôn ngữ trục trong dịch đa ngữ
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
PHAN THỊ LỆ THUYỀN
SỬ DỤNG NGÔN NGỮ TRỤC TRONG DỊCH ĐA NGỮ
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Đà Nẵng 2018
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
PHAN THỊ LỆ THUYỀN
SỬ DỤNG NGÔN NGỮ TRỤC TRONG DỊCH ĐA NGỮ
Chuyên ngành : KHOA HỌC MÁY TÍNH
Mã số : 62 48 01 01
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Người hướng dẫn khoa học: PGS.TS. Võ Trung Hùng
Đà Nẵng 2018
LỜI CAM ĐOAN
Tôi cam đoan đây là kết quả nghiên cứu của riêng tôi. Các nội dung và kết
quả nghiên cứu được trình bày trong Luận án là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.
Tác giả
NCS. Phan Thị Lệ Thuyền
LỜI CẢM ƠN
-
Trước tiên, tác giả xin gửi lời cảm ơn đến Ban Đào tạo - Đại học Đà Nẵng,
Khoa Công nghệ Thông tin, Phòng Đào tạo Trường Đại học Bách khoa - Đại học
Đà Nẵng đã tạo điều kiện thuật lợi trong thời gian học tập và nghiên cứu.
Tác giả muốn tri ân đến các Thầy Cô giáo Khoa Công nghệ Thông tin
Trường Đại học Bách khoa - Đại học Đà Nẵng, đặc biệt là thầy Võ Trung Hùng đã
tận tình giúp đỡ tác giả từ những bước đi đầu tiên hình thành ý tưởng, cũng như
trong suốt quá trình nghiên cứu. Thầy luôn ủng hộ, động viên và tạo điều kiện tốt
nhất để tác giả hoàn thành luận án. Tác giả nhận thấy sự trưởng thành sau những
năm được học tập và nghiên cứu dưới sự hướng dẫn của Thầy.
Tác giả chân thành cảm ơn các chuyên gia, các nhà ngôn ngữ học (PGS.TS
Nguyễn Ngọc Chinh, TS. Nguyễn Quý Thành) đã dành thời gian để hỗ trợ tác giả
nghiên cứu về mặt ngôn ngữ học, kiểm tra, đánh giá các kết quả dịch tự động và so
sánh chất lượng dịch các hệ thống. Sự giúp đỡ của các nhà ngôn ngữ học đã giúp
ích rất nhiều trong suốt quá trình nghiên cứu và hoàn thành báo cáo luận án này.
Tác giả xin gửi lời cảm ơn chân thành tới các anh chị NCS của Khoa Công
nghệ Thông tin Trường Đại học Bách khoa - Đại học Đà Nẵng, những người thân
và bạn bè luôn bên cạnh động viên, hỗ trợ về mặt tinh thần để tác giả vượt qua khó
khăn và hoàn thành tốt luận án.
-i-
MỤC LỤC
DANH MỤC HÌNH VẼ ................................................................................................... iv
DANH MỤC BẢNG ................................................................................................... vii
MỞ ĐẦU ....................................................................................................................... 1
Chương 1. TỔNG QUAN VỀ DỊCH MÁY VÀ NGÔN NGỮ UNL ........................ 7
1.1. Một số khái niệm sử dụng trong luận án ............................................................. 7
1.2. Một số hướng tiếp cận trong dịch tự động .......................................................... 9
1.2.1. Dịch máy dựa trên luật .............................................................................. 10
1.2.2. Dịch máy dựa trên ngữ liệu ....................................................................... 12
1.2.3. Phương pháp dịch kết hợp ......................................................................... 14
1.2.4. Đánh giá .................................................................................................... 15
1.3. Dịch đa ngữ ....................................................................................................... 16
1.4. Vấn đề dịch tự động cho tiếng Việt................................................................... 20
1.5. Tổng quan về UNL ............................................................................................ 22
1.5.1. Giới thiệu ................................................................................................... 22
1.5.2. Ngôn ngữ UNL ........................................................................................... 22
1.5.3. Hệ thống UNL ............................................................................................ 29
1.5.4. Một số kết quả nghiên cứu liên quan ......................................................... 31
1.5.5. Ứng dụng UNL làm ngôn ngữ trục trong hệ thống dịch đa ngữ ............... 33
1.6. Tiểu kết chương ................................................................................................. 35
Chương 2. ĐỀ XUẤT MÔ HÌNH DỊCH TIẾNG VIỆT - UNL ............................. 37
2.1. Đặt vấn đề .......................................................................................................... 37
2.2. Ngữ pháp tiếng Việt .......................................................................................... 39
2.3. Đề xuất mô hình dịch ........................................................................................ 41
-ii-
2.3.1. Công cụ EnCoVie ....................................................................................... 42
2.3.2. Công cụ DeCoVie ...................................................................................... 45
2.3.3. Từ điển trong UNL ..................................................................................... 46
2.3.4. Luật ngữ pháp trong UNL ......................................................................... 49
2.4. Một số vấn đề cần xử lý cho tiếng Việt............................................................. 56
2.5. Tiểu kết chương ................................................................................................. 58
Chương 3. GIẢI PHÁP XÂY DỰNG TỪ ĐIỂN VÀ LUẬT .................................. 60
3.1. Giải pháp xây dựng từ điển tiếng Việt - UNL................................................... 60
3.2. Giải pháp xây dựng luật ngữ pháp .................................................................... 69
3.2.1. Xây dựng luật mã hóa ................................................................................ 69
3.2.2. Xây dựng luật giải mã ................................................................................ 83
3.3. Tiểu kết chương ................................................................................................. 94
Chương 4. THỬ NGHIỆM VÀ ĐÁNH GIÁ ............................................................ 96
4.1. Xây dựng công cụ EnCoVie và DeCoVie ......................................................... 96
4.1.1. Xây dựng công cụ EnCoVie ....................................................................... 96
4.1.2. Xây dựng công cụ DeCoVie ....................................................................... 99
4.2. Thử nghiệm và đánh giá .................................................................................. 114
4.2.1. Từ điển tiếng Việt – UNL ......................................................................... 114
4.2.2. Dịch đa ngữ qua ngôn ngữ trục UNL ...................................................... 115
4.3. Tiểu kết chương ............................................................................................... 122
KẾT L ẬN ............................................................................................................... 123
TÀI LIỆ THAM KHẢO ....................................................................................... 128
PHỤ LỤC .................................................................................................................. 137
-iii-
ANH MỤC CÁC TỪ VIẾT T T
LGW Left Generation Window Cửa sổ tạo ra bên trái
LW Left Window Cửa sổ trái
RGW Right Generation Window Cửa sổ tạo ra bên phải
RW Right Window Cửa sổ phải
UNL Universal Networking Language Ngôn ngữ mạng dùng chung
UNLKB Universal Networking Language Cơ sở tri thức của ngôn ngữ
Knowledge Base mạng dùng chung
UW Universal Word Từ vựng chung
-iv-
ANH MỤC HÌNH VẼ
Hình . . Sơ đồ hệ thống dịch trực tiếp [13]............................................................. 11
Hình . . Sơ đồ hệ thống dịch chuyển đổi [13] ........................................................ 11
Hình . . Sơ đồ hệ thống dịch qua ngôn ngữ trung gian [13]................................... 12
Hình . . Sơ đồ hệ thống dịch dựa trên ví dụ [13] .................................................... 13
Hình . . Sơ đồ hệ thống dịch dựa trên thống kê [13] .............................................. 14
Hình . . Kết hợp phương pháp dịch dựa trên luật và thống kê [13] ....................... 14
Hình . . Mô hình dịch máy dựa trên luật ................................................................ 15
Hình . . Dịch trực tiếp giữa các cặp ngôn ngữ trong dịch đa ngữ .......................... 16
Hình . . ịch qua ngôn ngữ trục trong dịch đa ngữ ............................................... 17
Hình . . Mô hình đánh giá dịch trực tiếp và dịch qua ngôn ngữ trung gian ........ 17
Hình . . Biểu diễn câu tiếng Anh sang UNL ........................................................ 28
Hình . . Biểu diễn biểu thức UNL dưới dạng đồ thị ............................................. 29
Hình . . Cơ chế chuyển đổi của hệ thống UNL .................................................... 29
Hình . . Hệ thống UNL14 ...................................................................................... 30
Hình . . Quá trình chuyển đổi dữ liệu trong dự án UNL – EOLSS [15] .............. 33
Hình . . Hệ thống UNL cho các ngôn ngữ ........................................................... 34
Hình . . Dịch qua ngôn ngữ trục UNL.................................................................. 34
Hình . . Mô hình dịch tiếng Việt – UNL ................................................................ 42
Hình . . Sơ đồ chuyển đổi của công cụ EnCoVie ................................................... 43
Hình . . Danh sách các nút trong Node-list ............................................................ 43
Hình . . Sơ đồ liên kết các Headword .................................................................... 44
-v-
Hình . . Sơ đồ mã hóa câu tiếng Việt sang UNL .................................................... 44
Hình . . Sơ đồ chuyển đổi của công cụ DeCoVie .................................................. 45
Hình . . Mối quan hệ nhị phân giữa hai từ vựng .................................................... 45
Hình . . Sơ đồ mã hóa biểu thức UNL sang câu tiếng Việt .................................... 46
Hình . . Trạng thái cuối cùng của Node-list ........................................................... 46
Hình . . Sử dụng UW để tìm HeadWord trong quá trình giải mã ........................ 48
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “+”............................... 51
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “-” .............................. 52
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “<”............................... 52
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “>”............................... 53
Hình . . Thay đổi Node-list và cửa sổ phân tích bởi luật “:” ................................ 54
Hình . . Luật chèn phải một nút từ Node vào Node-list ....................................... 54
Hình . . Luật chèn trái một nút từ Node vào Node-list ........................................ 55
Hình . . Luật xóa nút phải một nút từ Node-list ................................................... 56
Hình . . Luật xóa nút trái một nút từ Node-list ..................................................... 56
Hình . . Mô-đun xử lý câu tiếng Việt đầu vào [9] ............................................... 58
Hình . . Luật ngữ pháp chuyển đổi tiếng Việt sang biểu thức UNL ...................... 69
Hình . . Đồ thị biểu diễn biểu thức UNL ............................................................... 83
Hình . . Mối tương quan giữa hai ngôn ngữ tiếng Việt và UNL ........................... 83
Hình . . Sắp xếp trật tự các từ câu đầu ra tiếng Việt ............................................. 84
Hình . . Sắp xếp trật tự các từ câu đầu ra tiếng Việt ............................................. 84
Hình . . Đồ thị UNL biểu diễn cho biểu thức có một nút con ............................... 84
Hình . . Đồ thị UNL biểu diễn cho biểu thức có nhiều nút con ............................ 86
-vi-
Hình . . Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 1 ............. 88
Hình . . Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 2 ............. 89
Hình . . Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 3 ........... 92
Hình . . Đồ thị biểu diễn biểu thức UNL ............................................................. 100
Hình . . Đồ thị biểu diễn biểu thức UNL chứa một hay nhiều nút con ............... 106
Hình . . Đồ thị biểu diễn biểu thức UNL chứa nút kết hợp ................................. 112
Hình . . Hệ thống dịch đa ngữ dựa vào UNL ...................................................... 118
Hình . . Biểu đồ chất lượng dịch qua UNL và dịch trực tiếp .............................. 120
-vii-
ANH MỤC BẢNG
Bảng . . Kết quả đánh giá qua tiếng Pháp ............................................................. 19
Bảng . . Kết quả đánh giá qua tiếng Đức ............................................................... 19
Bảng . . Tỷ lệ giống/khác giữa 2 bản dịch máy..................................................... 20
Bảng . . Các quan hệ được định nghĩa trong UNL [66] ......................................... 24
Bảng . . Các thuộc tính được định nghĩa trong UNL [66] ..................................... 25
Bảng . . Mô tả hình thức bảng trong biểu thức UNL [66]...................................... 27
Bảng . . Tỷ lệ giống/khác giữa dịch qua UNL và tiếng Anh ................................. 38
Bảng . . Các mô hình câu đơn [ ] ........................................................................ 40
Bảng . . Tập nhãn từ loại trong từ điển cho tiếng Việt [9] ..................................... 48
Bảng . . Tập nhãn từ loại con trong từ điển cho tiếng Việt [9] .............................. 49
Bảng . . Số mục từ tiếng Việt – UNL thu được với giải pháp thứ nhất ............... 115
Bảng . . Một số ví dụ câu không khớp ở máy chủ tiếng Anh ............................. 118
Bảng . . Tỷ lệ thay đổi giữa dịch qua UNL và trực tiếp ....................................... 119
1
MỞ ĐẦ
1. L chọn ề ài
Cùng với sự phát triển của công nghệ, con người đã tạo ra một lượng thông
tin khổng lồ trên mạng Internet được cung cấp từ hàng triệu Website trên khắp thế
giới. Nhưng chúng ta không thể khai thác hết thông tin bởi nhiều lý do và một trong
những lý do quan trọng nhất là rào cản về ngôn ngữ. Vấn đề đặt ra là làm thế nào để
mọi người trên thế giới có thể khai thác hết nguồn thông tin trên Internet mà không
bị hạn chế bởi ngôn ngữ? Hiện có hai giải pháp chính để giải quyết vấn đề này: thứ
nhất là phát triển các hệ thống, các ứng dụng, các nguồn dữ liệu đa ngữ để người sử
dụng có thể lựa chọn ngôn ngữ mà họ muốn khi sử dụng; thứ hai là ứng dụng các
phần mềm dịch tự động để dịch các giao diện, ... V, C phải V
73. Phải chi V, C cũng V
Nhóm 23 74. V, (C cũng V)
Nhóm 24 75. Hình như (C-V), (C đều V)
Nhóm 25 76. C càng V thì càng V
Nhóm 26 77. C càng phải V thì mới V
Nhóm 27 78. V là V
Nhóm 28 79. Muốn V mà (C-V) thì V
Nhóm 29 80. (V nhưng (C-V)) thì V
Nhóm 30 81. Nếu (C-V) thì (dẫu V, V)
Nhóm 31 82. Nếu V, V
CÂ NHÂN NHƯỢNG: Tuy (C –V) nhưng (C – V)
Nhóm 1 1. Tuy (C-V) nhưng (C-V)
2. Cho dù (C-V) nhưng (C-V)
3. Mặc dù (C-V) song (C-V)
4. ẫu (C-V) thì (C-V)
Nhóm 2 5. Mặc dù V nhưng (C-V)
6. Tuy V nhưng (C-V)
Nhóm 3 7. Mặc dù (C-V) (C-V)
8. Dù (C-V) (C-V)
Nhóm 4 9. Mặc dù V (C-V)
10. Dù cho V (C-V)
11. ẫu V (C-V)
Nhóm 5 12. (C-V) tuy (C-V)
13. (C-V) mặc dù (C-V)
Nhóm 6 14. (C-V) tuy V
15. (C-V) dù V
16. (C-V) mặc dù V
Nhóm 7 17. Mặc dù/ bởi V (C-V) nhưng (C-V)
Nhóm 8 18. C tuy V nhưng V
19. C dù V vẫn V
20. C tuy V mà V
21. C tuy V chớ V
Nhóm 9 22. ù V (C cũng V)
Nhóm 10 23. C dù V (c cũng V)
Nhóm 11 24. ẫu cho (C-V), V
30
25. Cho dù (C-V), V
Nhóm 12 26. ẫu vì/ V (C-V) nhưng V
Nhóm 13 27. (C-V) mặc dù vì V, (C-V)
CÂ MỤC ĐÍCH: (C-V) để (C-V)
Nhóm 1 1. (C-V) để (C-V)
2. (C-V) cho (C-V)
3. (C-V) để cho (C-V)
4. (C-V) cốt cho (C-V)
5. (C-V) cốt buộc (C-V)
6. (C-V) hòng buộc (C-V)
Nhóm 2 7. Để (C-V) (C-V)
8. Để cho (C-V) (C-V)
Nhóm 3 9. V để (C-V)
10. V cho (C-V)
Nhóm 4 11. (C-V) (C-V)
Nhóm 5 12. V, (C-V)
CÂU SO SÁNH: (C-V) như (C-V)
Nhóm 1 1. (C-V) như (C-V)
2. (C-V) tựa như (C-V)
3. (C-V) hệt như (C-V)
4. (C-V) giống như (C-V)
5. (C-V) y như (C-V)
6. (C-V) chẳng khác gì (C-V)
7. (C-V) hệt (C-V)
Nhóm 2 8. (C-V) hệt như V
9. (C-V) như V
10. (C-V) cũng như V
Nhóm 3 11. (C-V) chớ V như (C-V)
Nhóm 4 12. Đúng như (C-V) (C-V)
13. Như (C-V) (C-V)
Nhóm 5 14. V như (C-V)
Nhóm 6 15. (C-V) bao nhiêu thì (C-V) bấy nhiêu
CÂ BÌNH ĐẲNG: (C-V) và (C-V)
Nhóm 1 1. (C-V) và (C-V)
2. (C-V) rồi (C-V)
3. (C-V) sau đó (C-V)
4. (C-V) đồng thời (C-V)
5. (C-V) với lại (C-V)
31
6. (C-V) với (C-V)
7. (C-V) khi thì (C-V)
8. (C-V) có nghĩa là (C-V)
9. (C-V) cùng với (C-V)
10. (C-V) sau đó (C-V)
11. (C-V) tức là (C-V)
12. (C-V) nói đúng hơn là (C-V)
13. (C-V) ấy thế là (C-V)
14. (C-V) trong đó (C-V)
Nhóm 2 15. (C-V) (C-V)
Nhóm 3 16. (C-V) và V
17. (C-V) rồi V
18. (C-V) sau đó V
19. (C-V) đồng thời V
20. (C-V) trong đó V
Nhóm 4 21. V và (C-V)
22. V rồi (C-V)
23. V, sau đó (C-V)
24. V có nghĩa là (C-V)
25. V làm sao (C-V)
Nhóm 5 26. (C-V) đâu, V đó
Nhóm 6 27. (C-V) và (vì (C-V) nên V)
Nhóm 7 28. (C-V) và (càng V càng V)
Nhóm 8 29. (C-V) (vừa V vừa V)
30. (C-V) (tuy V nhưng V)
31. (C-V) (cũng V cũng V)
32. (C-V) (V mà V)
Nhóm 9 33. (C-V) V (phải)
34. (C-V) V (có thể)
35. (C-V) V (là)
Nhóm 10 36. (C-V), (C-V) mà/nếu (C-V) thì V
Nhóm 11 37. (C-V) nhưng (C-V) và (C-V)
38. (C-V) đi (C-V) rồi (C-V)
Nhóm 12 39. (C chỉ V) rồi V
Nhóm 13 40. (C-V) khi V, (C-V)
Nhóm 14 41. (Bên cạnh C chỉ có thể V nếu V), (C-V nếu V)
Nhóm 15 42. V rồi V
43. V đồng thời V
32
44. V có nghĩa là V
45. V và V
Nhóm 16 46. (C-V), V
Nhóm 17 47. V (C-V)
Nhóm 18 48. V, V cần phải
49. V, V phải
Nhóm 19 50. (C-V) cần phải, (C-V)
Nhóm 20 51. C không thể (V mà V), không thể (V mà còn V)
CÂ LỰA CHỌN: (C-V) HOẶC (C-V)
Nhóm 1 1. (C-V) hoặc (C-V)
2. (C-V) hay (C-V)
3. (C-V) hoặc là (C-V)
Nhóm 2 4. (C-V) hoặc V
5. (C-V) hay là V
Nhóm 3 6. V hay (C-V)
7. V hoặc (C-V)
CÂ TƯƠNG PHẢN: (C-V) nhưng (C-V)
Nhóm 1 1. (C-V) nhưng (C-V)
2. (C-V) chứ (C-V)
3. (C-V) vậy mà (C-V)
4. (C-V) ấy vậy mà (C-V)
5. (C-V) còn (C-V)
6. (C-V) không ngờ (C-V)
7. (C-V) ngờ đâu (C-V)
8. (C-V) hơn nữa (C-V)
9. (C-V) chỉ phải cái (C-V)
10. (C-V), ngược lại (C-V)
11. (C-V) trái lại (C-V)
12. (C-V) ngặt nổi (C-V)
13. (C-V) ai ngờ (C-V)
14. (C-V) chỉ có (C-V)
15. (C-V) với lại (C-V)
16. (C-V) song (C-V)
17. (C-V) mà (C-V)
Nhóm 2 18. (C-V) chứ V
19. (C-V) thế mà V
20. (C-V) thế tại sao V
21. (C-V) hơn nữa V
33
22. (C-V) lại V
23. (C-V) để rồi V
24. (C-V) chỉ V
25. (C-V) vậy mà V
26. (C-V) mà lại V
27. (C-V) mà còn V
28. (C-V) mà chỉ V
29. (C-V) mà V
30. (C-V) nhưng V
31. (C-V) song V
Nhóm 3 32. (C-V) nhưng/ nếu (C-V) thì (C-V)
33. (C-V) nhưng/ vì (C-V) cho nên (C-V)
34. (C-V) nhưng/ nhờ (C-V) mà (C-V)
Nhóm 4 35. (C-V) nhưng/ nếu (C-V), (C-V)
36. V nhưng/ khi (C-V), (C-V)
Nhóm 5 37. (C-V) lại (V còn V)
38. (C-V) nhưng (V thì V)
39. (C-V) chỉ ( V thì V)
40. (C-V) mà bởi (V nên V)
41. (C-V) mà (khi V thì V)
42. (C-V) lại (V thì V)
43. (C-V) ngặt nổi (V nên V)
Nhóm 6 44. V nhưng (C-V)
45. V song (C-V)
46. V chứ (C-V)
47. V mà (C-V)
48. V còn (C-V)
49. V không có (C-V)
50. V ngặt nổi (C-V)
Nhóm 7 51. (C-V) nhưng (C-V) vì (C-V)
52. (C-V) ngặt nổi (C-V) nên (C-V)
Nhóm 8 53. (C-V) nhưng (vì V (C-V))
Nhóm 9 54. (C-V) nhưng (V vì (C-V))
55. (C – C) mà chỉ (V mới (C-V))
Nhóm 10 56. V không thôi V
57. V chứ V
58. V không có V
59. V nhưng V
34
60. V mà V
61. V nhưng đồng thời V
62. V lại còn V
63. V lại V
Nhóm 11 64. Nếu V thì (C-V) nhưng (C-V)
Nhóm 12 65. V song (khi V thì V)
Nhóm 13 66. (V thì V), song (nếu V thì V)
Nhóm 14 67. (C – vốn V) chứ V
68. (C phải là V) chứ không thể V
69. (C có thể V) mà không cần V
70. (C không phải V) mà V
71. (C không thể chỉ V) mà V
72. (C cứ tưởng V) hóa ra V
Nhóm 15 73. (C-V) chứ (nếu (C-V) thì V)
Nhóm 16 74. (C-V) nên (C-V) chứ (nếu V thì (C-V))
Nhóm 17 75. (Hễ V thì thì V, (C-V)) chứ (V mà V thì V)
Nhóm 18 76. V nên (C-V) chớ (C-V)
Nhóm 19 77. (Nếu V thì V) mà (V thì V)
Nhóm 20
78. C không phải V mà (C-V)
79. Chưa có V chỉ có (C-V)
Nhóm 21 80. V không phải chỉ V mà V
Nhóm 22
81. Không phải V mà V
82. Một mặt V, mặt khác V
Nhóm 23 83. Chỉ mới V mà (C-V)
Nhóm 24 84. V mà/ tại V nên (C-V)
Nhóm 25 85. Không phải (C-V) mà V
Nhóm 26 86. Không nên V mà phải coi (C-V)
Nhóm 27 87. Từ (C-V), thế mà (C-V)
Nhóm 28 88. (C-V) (C-V)
Nhóm 29 89. (C-V)V
Nhóm 30 90. V (C-V)
CÂU GHÉP: C không chỉ V mà còn V
Nhóm 1 1. C không chỉ V mà còn V
2. C không những V mà còn V
3. C vừa V vừa V
4. C chẳng những V mà còn V
Nhóm 2
5. Không phải chỉ (riêng) (C-V) mà (C-V)
6. Chẳng những (C-V) mà (C-V)
35
Nhóm 3 7. Chẳng những (C-V) mà V
Nhóm 4
8. (C-V) càng V càng V
9. (C-V) vừa V vừa V
Nhóm 5 10. (C-V) (C-V)
Nhóm 6 11. Chẳng những V mà còn (C-V)
Nhóm 7 12. C càng V, C càng V
Nhóm 8 13. V không phải chỉ V mà còn V
Nhóm 9 14. Không những V mà còn V
Nhóm 10 15. Không phải C chỉ V mà là V
Nhóm 11
16. Vừa V, C vừa V
17. Càng V, C càng V
36
Phụ lục G. Mộ số mục ừ ừ iển iếng Việ – UNL và câu mẫu hử nghiệm
(Các mục từ được lấy từ kết quả thử nghiệm xây dựng từ điển của luận án)
STT MỤC TỪ TRONG TỪ ĐIỂN TIẾNG VIỆT - UNL
1. [kỹ sư]{}“engineer(icl>person>thing)”(n,nt);
2. [tôi]{}“I(icl>person)”(p,pp);
3. [chúng tôi]{}“we(icl>group)”(p,pp);
4. [anh ấy]{}“he(icl>person)”(p,pp);
5. [học sinh]{}“student(icl>university_student>person,obj>knowledge_domain
)”(n,nt);
6. [giáo viên]{}“teacher(icl>educator>thing)”(n,nt);
7. [nhà văn]{}“writer(icl>communicator>thing)”(n,nt);
8. [nhà báo]{}“journalist(icl>writer>thing)”(n,nt);
9. [thợ may]{}“tailor(icl>garmentmaker>thing)”(n,nt);
10. [họa sĩ]{}“artist(icl>creator>thing)”(n,nt);
11. [làm việc]{}“ work(icl>do,agt>person,obj>role,ben>volitional_thing)”(v,vs)
;
12. [ngủ]{}“sleep(icl>rest>be,aoj>living_thing)”(v,vs) ;
13. [ngồi]{}“sit(icl>be,aoj>person,plc>thing)”(v,vs) ;
14. [đứng]{}“stand(icl>be_upright>be,aoj>concrete_thing)”(v,vs) ;
15. [nói]{}“say(icl>communicate>do,equ>tell,agt>person,obj>uw,cao>thing,rec>voliti
onal_thing)”(v,vi) ;
16. [hát]{}“sing(icl>do,com>music,cob>thing,agt>living_thing,obj>song,rec>
living_thing)”(v,vi);
17. [khóc]{}“weep(icl>cry>do,rsn>thing,agt>living_thing)”(v,vi);
18. [gửi]{}“send(icl>direct>do,plt>uw,plf>thing,agt>volitional_thing,obj>thing,
rec>thing)”(v,vt);
19. [thư]{}“letter(icl>text>thing)”(n,na);
20. [bưu điện]{}“post(icl>upright>thing)”(n,ng);
21. [văn phòng]{}“office(icl>organization,icl>place,obj>organization)”(n,ng)
;
22. [trồng]{}“grow(icl>develop>do,equ>raise,src>thing,agt>thing,obj>thing,
gol>uw)”(v,vt);
23. [hoa]{}“flower(icl>angiosperm>thing)”(v,vt);
24. [trang trại]{}“farm(icl>workplace>thing)”(n,ng);
25. [mua]{}“buy(icl>get>do,cob>thing,src>thing,agt>person,obj>thing)”(v,vt)
;
26. [tài liệu]{}“paper(icl>material>thing)”(n,na);
37
27. [bán]{}“sell(icl>be_on_sale>be,aoj>thing,val>money)”(v,vt);
28. [bắt]{}“force(icl>cause>do,equ>compel,agt>thing,obj>thing,gol>uw)” (v,vt,
order);
29. [ăn]{}“eat(icl>consume>do,agt>living_thing,obj>concrete_thing,ins>thing)”
(v,vt);
30. [ở]{}“”(e);
31. [đi]{}“go(icl>move>do,plt>place,plf>place,agt>thing)”(v,vt);
32. [chạy]{}“run(icl>go>do,plt>uw,plf>uw,agt>thing)”(v,vt);
33. [khuyên]{}“advise(icl>counsel>do,agt>person,obj>uw,ben>person)”(v,vt,
order);
34. [học]{}“learn(icl>acquire>do,src>uw,agt>volitional_thing,obj>thing)”(v,vt)
;
35. [cấm]{}“forbid(icl>prohibit>do,agt>person,obj>uw,rec>person)”(v,vt,order)
vie,0,0>;
36. [yêu cầu]{}“request(icl>beg>do,agt>person,obj>uw,rec>person)”(v,vt,order)
;
37. [lỡ]{}“miss(icl>occur,com>fail,cob>thing,obj>thing)”(v,vt,order);
38. [vừa]{}“”(e);
39. [xe buýt]{}“bus(icl>public_transport>thing)”(n,nt);
40. [sẽ]{}“”(e);
41. [đến]{}“come(icl>move>do,plt>place,agt>person)”(v,vt);
42. [muộn]{}“late(icl>how,ant>early)”(a,ap);
43. [tàu]{}“ship(icl>vessel>thing)”(n,nt);
44. [trở thành]{}“become(icl>occur,obj>thing,gol>uw)”(v,vs);
45. [chăm chỉ]{}“studiously(icl>how,com>studious)”(a,ap);
46. [tốt]{}“well(icl>how)”(a,ap);
47. [luật sư]{}“lawyer(icl>professional>thing)”(n,nt);
48. [công bằng]{}“fairly(icl>how,com>fair)”(a,ap);
49. [tạp chí]{}“magazine(icl>press>thing)”(n,nt);
50. [giải trình]{}“explain(icl>do,equ>explicate,agt>volitional_thing,obj>uw, cao
>thing,met>thing,rec>thing)”(n,nt);
51. [chuyến bay]{}“flight(icl>air_travel>thing)”(n,nt);
52. [nghe]{}“listen(icl>hear>do,agt>person,obj>thing)”(v,vt);
53. [đọc]{}“read(icl>see>do,agt>person,obj>information)”(v,vt);
54. [viết]{}“write(icl>communicate>do,agt>person,obj>information,cao>thing,
ins>thing,rec>person)”(v,vt);
55. [nhảy]{}“dance(icl>move>do,com>grace,agt>person,obj>thing)”(v,vt);
38
56. [xem]{}“watch(icl>do,equ>view,agt>living_thing,obj>thing)”(v,vt);
57. [đỗ]{}“pass(icl>cross>do,via>thing,plt>thing,plf>thing,agt>thing,plc>thing)”(v,vs)
;
58. [học kì]{}“semester(icl>school_term>thing)”(n,na);
59. [có]{}“have(icl>be,equ>possess,obj>thing,aoj>thing)”(v,vs);
60. [tiền]{}“money(icl>medium_of_exchange>thing)”(n,na);
61. [chạy]{}“run(icl>go>do,plt>uw,plf>uw,agt>thing)”(v,vt);
62. [nhanh]{}“fast(icl>adj,ant>slow)”(a,ap);
63. [chiến thắng]{}“win(icl>prize>do,agt>volitional_thing,obj>thing,cag>
volitional_thing,scn>thing)”(v,vs);
64. [giải thưởng]{}“prize(icl>gift>thing)”(n,na);
65. [chậm]{}“slow(icl>adj,ant>fast)”(a,ap);
66. [mất]{}“lose(icl>suffer>do,agt>thing,obj>concrete_thing)”(v,vs);
67. [thần tượng]{}“idol(icl>effigy>thing)”(n,na);
68. [tính toán]{}“calculate(icl>rely>be,obj>person,aoj>person,scn>thing)”(v,
vt);
69. [cẩn thận]{}“carefully(icl>how,com>careful)”(a,ap);
70. [tiến bộ]{}“ improve(icl>turn>occur,equ>better,obj>thing)”(v,vs);
71. [toán học]{}“math(icl>science>thing,equ>mathematics)”(n,na);
CÂ MẪ THỬ NGHIỆM
STT TIẾNG VIỆT TIẾNG ANH TIẾNG NGA
1. Tôi là kỹ sư I am an engineer Я инженер
2. Chúng tôi là kỹ sư We are engineers Мы инженеры
3. Anh ấy là kỹ sư He is an engineer Он инженер
4. Tôi là học sinh I am a student Я студент
5. Chúng tôi là học sinh We are students Мы студенты
6. Anh ấy là học sinh He is an student Он студент
7. Tôi làm việc I work Я работаю
8. Chúng tôi làm việc We work Мы работаем
9. Anh ấy làm việc He works Он работает
10. Tôi ngủ I sleep Я сплю
11. Chúng tôi ngủ We sleep Мы спим
12. Anh ấy ngủ He sleeps Он спит
13. Tôi gửi thư ở bưu
điện
I send a letter at the post Я отправляю письмо в
почтовом отделении
14. Chúng tôi gửi thư ở
bưu điện
We send a letter at the post Мы отправляем письмо в
почтовом отделении
39
15. Anh ấy gửi thư ở bưu
điện
He sends a letter at the
post
Он отправляет письмо в
почтовом отделении
16. Tôi gửi thư ở văn
phòng
I send a letter at the office Я отправляю письмо в
офисе
17. Chúng tôi gửi thư ở
văn phòng
We send a letter at the
office
Мы отправляем письмо в
офисе
18. Anh ấy gửi thư ở văn
phòng
he sends a letter at the
office
Он отправляет письмо в
офисе
19. Tôi bắt anh ấy ăn I force him to eat Я заставляю его есть
20. Chúng tôi bắt anh ấy
ăn
We force him to eat Мы заставляем его есть
21. Anh ấy bắt tôi ăn He forces me to eat Он заставляет меня есть
22. Tôi bắt anh ấy đi I force him to go Я заставляю его идти
23. Chúng tôi bắt anh ấy
đi
We force him to go Мы заставляем его идти
24. Anh ấy bắt tôi đi He forces me to go Он заставляет меня идти
25. Tôi vừa lỡ xe buýt, tôi
sẽ đến muộn
I have missed the bus, I
will come late
Я только что пропустил
автобус, я опоздаю
26. Chúng tôi vừa lỡ xe
buýt, chúng tôi sẽ đến
muộn
We have missed the bus,
we will come late
Мы только что пропустили
автобус, мы опоздаем
27. Anh ấy vừa lỡ xe
buýt, anh ấy sẽ đến
muộn
He has missed the bus, he
will come late
Он только что пропустил
автобус, он опоздает
28. Tôi nhảy và anh ấy
xem
I dance and he watches Я танцую, и он смотрит
29. Chúng tôi nhảy và
anh ấy xem
we dance and he watches Мы танцуем и он смотрит
30. Nếu anh ấy học chăm
chỉ thì anh ấy sẽ đỗ
học kì
If he learns studiously, he
will pass the semester
Если он будет усердно
учиться, он сдаст экзамены
31. Nếu tôi học chăm chỉ
thì tôi sẽ đỗ học kì
If I learn studiously, he
will pass the semester
Если я буду учиться, я cдам
экзамены
32. Nếu chúng tôi học
chăm chỉ thì chúng tôi
sẽ đỗ học kì
If we learn studiously, he
will pass the semester
Если мы будем усердно
учиться, мы cдадим
экзамены.
File đính kèm:
luan_an_su_dung_ngon_ngu_truc_trong_dich_da_ngu.pdf

